(本篇文章,整理自我們在 COSCUP 2013 之後一群人於 BizLePro 聚會分享的內容。)
今年在 COSCUP 2013 聽到一場分享是關於 Wikidata,由來自德國 Wikidata 的 Nightrose (Lydia Pintscher) 所分享。這幾年也一直在構思如何整理一些瑣碎、片段的資訊並且從中萃取出資訊不對稱的資料(或資訊、或行動方案),也許未來可以做成「創業題目產生器」之類的玩意兒,或是給投資人使用的新創公司分析報告產生器之類的東西。(先暫停嘴砲模式,進入 Wikidata 的介紹吧)
滿愛這種開放式資訊分享的架構跟想法,從 Wikipedia 到 Wikidata,在收集到越來越多的資料後,通常會遇到過往(開頭時)設計的資料庫結構不敷使用或是有新的應用需求而需要作調整。Wikidata 也是基於多年的 Wikipedia 運作經驗累積得到的經驗值之後轉化的產物之一。
我之前還沒找到 Lydia 在網路上的投影片。後來有找到了:在這裡。下面則是她同事在 slideshare 上面類似內容的投影片(因為可以嵌入,所以,哈)。
有趣的是投影片中有一些世界地圖的照片,是各個語系在世界各地使用者取用該語系的地理位置分布狀況。可以看出來英文的分布最廣泛,然後看到的法文也滿廣的,但是其他語系就越來越侷限存取位置(也許也有關於存取量)。但如果知識或資訊的取用,不會被語言所隔閡,那也許可以創造其他的可能性。
我自己的理解是:Wikidata 的開始就是想要作些改變,讓資料與資料之間的關係作個整理,從「關係」中可以取得「資訊」,進而使用這些資訊再做處理,例如翻譯成各種語系,或是取用現成的翻譯可以直接整理 (render) 出資訊呈現結果。(我延伸想到的專案是 Mozilla Popcorn 專案。)
現場 Lydia 以「台北」作為示範:http://www.wikidata.org/wiki/Q1867
- Q1867 是這個條目(或稱項目)的一個編號。數字大小本身應該是依照建議的順序排列。應該會把重點放在項目與項目之間的關聯性。
- 可以從中看出來跟「台北」有關的姊妹市 (twin city) 有哪些等等關聯資訊。(現場 Lydia 還直呼,哇!這麼多姊妹市!XD)
這裡有一張動態的圖,以世界地圖的亮點,紀錄了 Wikidata 的成長:https://commons.wikimedia.org/wiki/User:Denny/Wikidata_growth
藉由 Wikidata API query 可以整理出一些有趣的資訊,例如:
- http://simia.net/treeoflife/
- http://toolserver.org/~magnus/ (很多 query 範例)
- http://tools.wmflabs.org/reasonator/?q=Q42 (重新排版呈現 Q42 這個條目)
- http://toolserver.org/~magnus/thetalkpage/ (我覺得這個最有趣,可以用對話的方式問問題,然後機器人會去查 wikidata 的資料作互動。想不到要問什麼問題的話,也有現成的範例問題在頁面上可以直接玩。)
0 Comments:
Post a Comment