DataList

從 集智百科
跳到: 導覽搜尋

應該積累一批高精度、長時間的重要社會科學的數據。

目錄

數據列表

  1. Code and Data for The spread of true and false news online 2018-03-11 23:30:59 We are indebted to Twitter for providing funding and access to the data. We are also grateful to members of the MIT research community for invaluable discussions. The research was approved by the MIT institutional review board. The analysis code is freely available at https://goo.gl/forms/AKIlZujpexhN7fY33. The entire data set is also available, from the same link, upon signing an access agreement stating that (i) you shall only use the data set for the purpose of validating the results of the MIT study and for no other purpose; (ii) you shall not attempt to identify, reidentify, or otherwise deanonymize the data set; and (iii) you shall not further share, distribute, publish, or otherwise disseminate the data set. Those who wish to use the data for any other purposes can contact and make a separate agreement with Twitter.

重要問題

大家都關係的問題。Github Archive 的數據就是數據規模很大、格式變化、維度有限。

積累變量,而不僅僅是數據

  • 比如web of science的數據,數據的規模很大,非常多的人投入到這個數據的分析和挖掘過程中來。
  • 面對種數據,從建立一個新的研究的角度切入,就需要從某一個核心概念和變量切入。

快變量+慢變量

  • 入伍對收入的影響

長時間數據vs高精度數據

變量直接聯繫社會現實

將社會科學的故事(比如階級)同這種直接聯繫社會現實的測量聯繫起來。

  • facebook數據最難拿
  • 產業和組織數據相對好拿
個人工具
名字空間
動作
導覽
工具箱