Forget Big Data, Small Data is the Real Revolution
There is a lot of talk about “big data” at the moment. For example, this is Big Data Week, which will see events about big data in dozens of cities around the world. But the discussions around big data miss a much bigger and more important picture: the real opportunity is not big data, but small data. Not centralized “big iron”, but decentralized data wrangling. Not “one ring to rule them all” but “small pieces loosely joined”.
中央集積型データ管理が大きな話題になっている、たとえば、世界中の多くの都市で今週は“中央集積型データ管理の週”のイベントが開催されている。しかし、中央集約型データ管理の話題はもっと大きくてもっと重要な事実を見過ごしている。事実、中央集積型データ管理ではなく分散型データ管理を見過ごしている。中央に集積されたデータ用大型コンピュータではなく、分散したデータの結合である。一つの輪の中に集中させるのではないが、分散し緩く結合したシステムである。
現在では大きなデータが取りざたされることがおおい。たとえば今週はビッグ・データ週間で、世界中の都市の何ダースもの大きなデータをお披露目するイベントだ。しかしビッグ・データに関する討論は大きな盲点となっとり、もっと大切なことを忘れている:真のチャンスはビッグ・データではなく、スモール・データだ。集中させた鉄の塊ではなく、分散されたデータが熱烈な議論となっている。「ひとつの指輪がすべてを支配する」ではんく、「小さな欠片が集合する」なのだ。
Big data smacks of the centralization fads we’ve seen in each computing era. The thought that ‘hey there’s more data than we can process!’ (something which is no doubt always true year-on-year since computing began) is dressed up as the latest trend with associated technology must-haves.
Meanwhile we risk overlooking the much more important story here, the real revolution, which is the mass democratisation of the means of access, storage and processing of data. This story isn’t about large organisations running parallel software on tens of thousand of servers, but about more people than ever being able to collaborate effectively around a distributed ecosystem of information, an ecosystem of small data.
ここで、もっと重要な話を見過ごす危険がある。本当の革命はデータのアクセス、保管そして処理という意味の大量民主化である。この話は数千台のサーバーを並列処理ソフトで運用している大きな会社のことではないが、分散型エコシステムの情報を効果的に利用することのできない人よりもっと小さいエコシステムを使いきれない人の話である
私たちは本当の革命、つまりはデータにアクセスし、データを保管し、データを処理する民主化へと導く革命の重要な物語を見過ごしてしまうリスクにある。これはたくさんのサーバーを駆使して多くのソフトを並行操作する大企業に限ったことではない。小さなデータの生態、情報の生態を効果的に使うことのできる個人の問題でもある。
一方で、私たちはより重要なポイントを見過ごす危険性があります。本当の革命、つまりデータへのアクセス、蓄積、プロセスが示す大規模な民主化です。これは大きな組織が何万ものサーバー上でいくつものソフトウェアを平行して稼動させているということではなくて、より多くの人々が多数のコンピュータで分散処理されている生態系の周りで小さなデータを効率よく共同作業ができるということが重要なのです。
Just as we now find it ludicrous to talk of “big software” – as if size in itself were a measure of value – we should, and will one day, find it equally odd to talk of “big data”. Size in itself doesn’t matter – what matters is having the data, of whatever size, that helps us solve a problem or address the question we have.
For many problems and questions, small data in itself is enough. The data on my household energy use, the times of local buses, government spending – these are all small data. Everything processed in Excel is small data. When Hans Rosling shows us how to understand our world through population change or literacy he’s doing it with small data.
おおくの問題と疑問にとって、スモール・データだけで十分だ。家庭での電力消費のデータ、市バスの時刻表、政府の出資――これらはスモール・データだ。Hans Roslingが人口変化でどのように世界を理解するのかとか、彼がスモール・データを使って文学を書いているのかを教えてくれる。
たいていの問題も疑問も、小さなデータだけで事足ります。我が家のエネルギー消費量、地元で運行しているバスの時刻表、政府の支出、これらは全て小さなデータです。エクセルで処理されるあらゆる事柄は小さなデータなのです。ハンズ・ロスリングも小さなデータを使用することによって、人口の変遷や識字能力を介して、世界の様相を示しています。
And when we want to scale up the way to do that is through componentized small data: by creating and integrating small data “packages” not building big data monoliths, by partitioning problems in a way that works across people and organizations, not through creating massive centralized silos.
This next decade belongs to distributed models not centralized ones, to collaboration not control, and to small data not big data.
Want to create the real data revolution? Come join our community creating the tools and materials to make it happen — sign up here:
http://blog.okfn.org/2013/04/22/forget-big-data-small-data-is-the-real-revolution/
次の十年間は分配したモデルに属しているのであって、集中させたものにではない。強力させることであって、支配することではない。スモール・データであって、ビッグ・データではない。
本当の革命を起こしたい? それを実現させるためのツールと資源を創造しようと試みる我々に賛同するのだ。――ここから登録しよう。
http://blog.okfn.org/2013/04/22/forget-big-data-small-data-is-the-real-revolution/
次の10年は中央集権的なモデルではなく分散型のモデルが、管理ではなくコラボレーションが、ビッグデータではなくスモールデータが主流になる。
本当のデータ革命を起こしたいなら、我々のコミュニティに参加しそれを実現するためのツールや素材を構築しよう。登録はここからだ。
http://blog.okfn.org/2013/04/22/forget-big-data-small-data-is-the-real-revolution/
今後10年間は、集中型でなく散布型のモデルに、統制より協力、大きなデータより小さなデータに従います。
実際にデータ改革を起こしたいのでしたら、そのためのツールや材料をつくり出す我々の団体にぜひご参加を。下記にて、ご登録下さい。