天天看點

大資料時代社會科學在發生巨變,六年來SMP如何基于興趣驅動促進學科發展?

傳統意義上來說,我們會認為社會科學大多隻能是定性/半定量分析的科學,例如社會學、心理學、文學、曆史學。但當進入21世紀,伴随着大資料、雲計算和人工智能的出現,這些領域在定量分析方面出現了蓬勃的發展。例如文學方面,舉個例子,有人爬取《冰與火之歌》原著中人物資料,建構人物之間的社交關系網絡,定量分析為什麼這部著作堪稱經典。再例如通過爬取微網誌資料來定量地分析宗教群體之間的關系網絡。同樣的大資料也可以用來定量地分析諸如經濟發展規律、曆史演化等等。可以說大資料、雲計算和人工智能的發展讓傳統的這些社會科學煥發出了新的生機,社會科學已然在發生着巨變。

《冰與火之歌》社交網絡圖:點的大小代表角色的點度,即出現頻次;顔色代表walktrap聚類的結果;線的粗細代表聯系的緊密程度,顔色與聚類方式一緻。聚類問題将在本文第三部分具體講述。圖檔來源:dt财經

伴随着這種巨變的發生,哈工大的劉挺教授在2012年發起了首次全國社會媒體處理大會(SMP),希望通過這種形式給各個領域的專家提供一個思維碰撞的平台,以計算為背景,交叉應用到各個領域, 以加速傳統學科深刻的變化。

經過數年的發展,今年9月14日-17日SMP專委會在北京成功舉辦了第六屆全國社會媒體處理大會(SMP 2017)。在四天的議程(兩天講習班、兩天主會)中,分别有來自各個領域的專家(例如金融、情感、傳播學、教育、企業等)就大資料、人工智能等在該領域的革命性研究做出了精彩報告。大會現場幾乎場場爆滿,幾乎每個報告都能給聽衆帶來很多富有啟發的觀念。

在大會結束後,雷鋒網就SMP大會的情況分别采訪了大會的發起人劉挺教授、專委會秘書長唐傑副教授和本屆大會程式委員會主席沈華偉副研究員,了解到了SMP大會的一些詳細情況。

劉挺教授,SMP大會發起人,SMP專委會主任,哈爾濱工業大學教授,社會計算與資訊檢索研究中心主任

唐傑副教授,SMP專委會副主任、秘書長,清華大學副教授

沈華偉副研究員,SMP專委會副主任、SMP2017大會程式委員會主席、中科院計算所副研究員

雷鋒網:劉教授,SMP大會是由您在2012年發起的,當時您是基于什麼樣的想法去做這件事情的?經曆這麼多年,您覺得您對SMP大會的定義有發生變化嗎?

劉挺:SMP大會全稱“社會媒體處理大會“,2012年策劃這個大會的初衷是希望能夠加強多學科融合(尤其是計算機科學、社會學、傳播學、管理學、語言學等多學科交叉),針對産業發展和使用者需求,加強學術交流、拓展創新思路,推動我國社會媒體處理理論研究與技術應用的持續發展。SMP大會經過這幾年的發展,規模和影響力在逐漸擴大,但核心理念沒有變化。

SMP能夠發展到今天,受到大家的熱情關注,主要是順應和滿足了社會媒體處理相關領域各方人士交流與合作的強烈需求。回想起來,2012年末,微網誌得到了很大的發展,海量的微網誌内容成為各相關領域學者共同感興趣的大資料,經過一兩年的工作積累,很多學者、學生和企業界人士都迫切需要一個交流的平台,我順應了這個需求,在微網誌上發了一個文章,倡議組織一個完全興趣驅動的學術、技術交流會,很快有400多人響應,會議就開起來了。這樣的初心一直保持到今天。

雷鋒網:SMP會議目前已經經曆了六屆,在這六年當中SMP經曆了怎麼樣的變化?

唐傑:2012年SMP大會在自願報名參加的原則下舉行,結果一下子通過微網誌聚集了400多人;2013延續了2012年的組織架構,相對前一年則更加側重工業界的示範,大會非常成功,吸引了近500人參加。經過兩年的準備,我們籌備成立了中國中文資訊學會社會媒體處理專委會(SMP)。

2014年,SMP大會開始按照标準大會的方式進行組織,大會增加了論文投稿環節,但會議仍然采取免費注冊的方式,大會非常成功,吸引了700-800人參加。

2015年,我們開始策劃在外地舉辦大會,第一次離開北京,大家還是忐忑不安的。SMP來到了廣州,由華南理工大學承辦,大會繼續秉承免費注冊的原則,這次在京外的嘗試延續了之前在北京的成功。

2016年專委會決定将大會舉辦地定在江西南昌,由江西師範大學承辦,第一次嘗試收費注冊,還增加了使用者畫像技術評測(吸引200多支隊伍參賽),最終有400多人注冊參會,值得一提的是,大會最後一天各個論壇以及最後的閉幕式都有很多人堅持參加,大會内容的吸引力可見一斑。

今年大會再次回到北京,由中國科學院計算技術研究所承辦,今年新增了講習班、中文人機對話技術評測,還将論壇數由4個增加到了8個,大會吸引了600多人注冊,創下SMP大會收費注冊人數之最。

興趣驅動是SMP的基石,清新、輕松、務實、守時是SMP的風格,SMP上的報告沒有空泛的内容,更沒有廣告式的語言,參加SMP可以獲得實實在在的收獲,這是SMP不斷發展壯大的重要原因。

雷鋒網:本屆大會參會人數有多少?參會人員成員比例大概多少?

沈華偉:本屆大會有600多人注冊參加,實際參會人數約800人。參會人員以學術群體為主。約占70%(其中學生40%),企業和媒體參會人員約占25%。

雷鋒網:本屆活動贊助商有哪些?贊助經費大概有多少?接受贊助有哪些衡量标準?

沈華偉:本屆大會得到了企業的大力贊助。贊助分為四個級别:鑽石贊助商、金牌贊助商、銀牌贊助商和銅牌贊助商。本次會議的鑽石贊助商是騰訊;金牌贊助商包括拓爾思、科大訊飛、三角獸、國雙、微網誌;銀牌贊助商是百度和今日頭條;銅牌贊助商是知微資料和考拉新媒。本次會議的贊助經費也是SMP大會曆屆之最。

隻要是在社會媒體處理領域開展工作的企業,相信自己可以通過贊助SMP獲得收益,比如:提升企業品牌價值,擴大影響力,找到學術界合作夥伴,發現優秀人才等,就歡迎贊助SMP。

雷鋒網:劉教授,根據您在開幕式上的介紹,大會已經或準備籌劃的專業組有十多個。這些專業組是基于什麼樣的考慮成立的?和SMP大會屬于什麼樣的關系?

劉挺:目前專委會成立或籌劃的專業組共有十多個,目前正式成立的專業組包括:情感分析專業組 (SMP-SENT)、計算傳播學專業組 (SMP-CCC)、計算社會學專業組 (SMP-SOC)、資料挖掘專業組 (SMP-KDD)、表示學習專業組 (SMP-RL),此外今年有兩個新的論壇分别由籌劃中的智能教育專業組 (SMP-EDU)和智能金融專業組 (SMP-FINTECH)發起組織的。成立專業組,是希望專委會委員聚在一起組織小型論壇,研讨各個子領域的最新進展,同時專業組還會不定期地舉辦專業組活動,例如今年6月上旬在山西舉辦的情感分析專業組論壇和6月下旬在杭州舉辦的資料挖掘專業組論壇。從隸屬關系來看,SMP大會和專業組都屬于社會媒體處理專委會上司下的活動和分支組織。

雷鋒網:看昨天微信朋友圈裡大家給特邀嘉賓王偉老師過生日,特别有人情味;浏覽過去幾屆大會的内容,也發現有很多老師曆年來都參與到大會的組織和報告的第一線。相比國内别的計算機領域的大會,SMP是如何建構這個大家庭的?

唐傑:社會媒體處理專委會是中國中文資訊學會下屬的專業委員會,從成立至今不到五年,專委會很年輕,但也同時充滿活力,吸引了大量從事一線工作的學者。大會的第一天正好是美國加州大學洛杉矶分校(UCLA)王偉教授的生日,專委會給王教授買了生日蛋糕,并集體為王教授慶祝了生日。這展現了專委會以興趣為基礎、以友誼為紐帶的風格。

雷鋒網:SMP大會目前還有哪些不足?以後(例如下屆)會有什麼樣的規劃和改變?

劉挺:專委會還比較年輕,在很多規則和制度方面還不夠明确和完善,目前專委會正在積極努力一步步完善補充。SMP大會的多數代表來自計算機領域,我們未來會努力吸引更多來自社會科學領域的學者、學生參會。新的專業組正在醞釀,比如計算文化學、計算曆史學等,計算技術進入到傳統的人文學科中,會帶來全新的視角,得到一些新穎有趣的研究結果。

雷鋒網:目前大會無論是邀請來作報告的老師,還是參會的人員都是中國人(華人)。大會是否有計劃走向國際化?

唐傑:大會定位還是一個國内會議,暫時還沒有走向國際化的計劃,但大會積極開展和國際學者的交流與合作—計劃每年的大會特邀講者中都有來自國外的頂級學者參加,例如今年的特邀講者就包括來自美國的王偉教授和來自港澳台的祝建華教授。此外,我們還邀請了騰訊AI Lab的張潼博士、和微軟亞洲研究院副院長劉鐵岩博士等,從特邀講者和演講内容來看,SMP大會是非常國際化的。

另外據雷鋒網了解,第七屆全國社會媒體處理大會(SMP 2018)将會于七、八月份間在涼爽的哈爾濱舉辦,想要了解社會科學在大資料、人工智能在影響下的巨變,一定不容錯過。

本文作者:camel

繼續閱讀