來自立陶宛考納斯工業(yè)大學(KTU)的一位年輕研究員Domantas Didziapetris創(chuàng)建了一種基于人工智能的解決方案,用于測量紐約曼哈頓的情緒氣候。在對超過36,000條推文進行情感分析之后,他創(chuàng)建了一個量表,該量表指示居民和訪客如何評價曼哈頓不同街區(qū)的情感氣候。
紐約是世界上訪問量最大的城市之一。根據(jù)官方數(shù)據(jù),2018年,紐約市接待了創(chuàng)紀錄的6520萬游客,并且這一數(shù)字還在不斷增長。曼哈頓是紐約市五個行政區(qū)中人口最稠密的地區(qū),人口270萬,每年吸引近1500萬游客。
KTU建筑與土木工程學院的Domantas Didziapetris說:“曼哈頓是充滿生命的紐約市的心臟。如果不是一個從不睡覺的城市,那么有什么更好的地方來測試一種新方法呢?”
這位年輕的研究人員認為,城市分析方法通常仍使用紙質或在線調(diào)查。但是它們并不總是可靠的,結果可能并不代表實際情況。
“與深入的調(diào)查表相比,一眼看到社交媒體平臺可以提供對實際情況的更多洞察。此外,此處表達的觀點更具表達力和沖動性,因為人們在感到自己的那一刻就傾向于在網(wǎng)上表達喜悅或失望收集此類數(shù)據(jù)的最佳平臺之一是Twitter,因為它限制了消息中的字符數(shù),很容易將數(shù)據(jù)個性化,并且一旦用戶注冊Twitter,就已經(jīng)同意共享數(shù)據(jù)。” Didziapetris解釋說。
編寫了一些IT程序來處理數(shù)據(jù)。首先,使用Python來編譯可實時收集推文的軟件。在大約4個月的時間內(nèi),收集了超過100萬條推文,其中65,447條具有地理坐標。刪除來自曼哈頓以外的所有條目后,將對36,543條推文進行進一步分析,并按照紐約市開放數(shù)據(jù)門戶網(wǎng)站中確定的社區(qū)區(qū)域邊界進行分類。
其次,研究人員創(chuàng)建了一個程序,用于對推文進行情感分析??紤]了兩個標準-主觀性和極性。主觀性表示推文的實際內(nèi)容和極性(即其情感基調(diào))。這兩個條件的等級可以從-1到+1。
Didziapetris解釋說:“主觀性標準越高,輸入的可靠性就越低。極性越接近-1,則鳴叫的情感語調(diào)越不積極。”
情感分析結果被投影在地圖上,據(jù)這位年輕的研究人員稱,這清楚地表明了哪些社區(qū)可以說是幸福的,哪些并不那么開心。上西區(qū)在曼哈頓的情感氣候最不利。
上西區(qū)的面積仍然太大,無法得出結論。因此,有必要指出需要審查和進一步發(fā)展的實際位置。
為了完成此任務,使用了MIT于2011年創(chuàng)建的用于城市網(wǎng)絡分析的工具包“用于ArcGIS的城市網(wǎng)絡分析工具箱”。其間的一種方法-中間性-通常用于計算和估計網(wǎng)絡中過路者的潛力。該區(qū)域越遠,地圖上的顏色就越暖(紅色)。
“該地區(qū)交通不便,被遺棄的地區(qū)也就更多,而這些被遺棄的地區(qū)通常更容易受到犯罪活動的影響。經(jīng)過城市網(wǎng)絡分析,附近的區(qū)域之一看起來特別可疑-可視化后,它變成了藍色和綠色。我從該地區(qū)收到照片后,就證明了我的假設。簡而言之,它缺乏安全性。拍了照片的主管說,該地區(qū)的普遍感覺是“不安全”,“不舒適”,“鼓勵盡快離開”,“陳舊”。真正有趣的是,該地區(qū)位于東部附近活躍且可到達的建筑物附近,例如林肯中心,茱莉亞中學。” Didziapetris說。