- 2007年6月24日 17:27
- 地図
ちょっと前の記事ですが。個人的に気になる記事です。
「見えなかった情報」を可視化――NII、論文300万件をGoogle検索対象に (ITmedia News)
http://www.itmedia.co.jp/news/articles/0705/25/news041.html
国立情報学研究所(NII)が4月から、国内の学術論文情報300万件のデータベース「CiNii」(サイニイ)をGoogle検索対象にした。同時に、データベースも検索エンジンが見つけやすい形に変更。一般ユーザーが論文情報にアクセスしやすくした。
最近,論文タイトルでGoogle検索すると,国内論文が多く引っかかるようになり,とても便利になりました。これはCiNiiのおかげですなんですね。この記事によると,論文データベースをGoogle検索でひっかかるように開放し,Google Scalar(学術文献の検索)とも連携したようです。
感じとしては,自分たちで,まずデータベースを構築・改善し,「Googleさん,データベースをインデックス化して検索しやすくしたので,使ってください。」という感じで取り込んだのではないでしょうか。このやり方は,Googleとの付き合い方を考える上で,非常に有効な方法だと考えられます。
各分野では,いろいろな既存の情報が保有されていて,陽の目を見ない情報や,Googleキーワード検索で簡単にひっかかってしまう情報も混在しているわけです。そういう情報を,CiNiiのようなサイトを構築し,検索エンジンと連携も可能とすることは,とてもメリットがあると思うのです。
CiNiiのデータは、マシンで情報を収集・整理するGoogleとは対照的。学者が手で書き、査読し、学会で精読し、学会誌に掲載した論文に、被引用数を手作業で確認して作っており、何人もの人が膨大な手間ひまをかけている。人の手で整理した情報にはロボット検索にはない価値がある。「キーワード検索では、周辺の分野や、他の情報との関連性が見えづらい。手作業で整理した論文情報のページには、著者や掲載誌、引用情報などが書かれているから、ここを起点にして周辺情報に触れることができる」(大向氏)。各論文情報ページにはパーマネントリンクが付いており、それぞれのページが情報ポータルになる。
Googleによって,情報を全てインデックス化されてしまう前に,自分達が必要と考えられる方法でデータベースを構築し,インデックス化するべきだと思います。そうすれば,互いに手を組むことで,検索エンジン側としてはインデックス化する手間が省け,情報を保有していた側は,検索エンジンを通してデータを公開でき,自分達の領域を守ることができるわけです。つまり,お互いにハッピーですね。
GISの分野の人たちは,空間情報を自前でインデックス化できればいいのですが,既に侵食されてきているので,難しいでしょうね。
- Newer: 東京アメッシュがリニューアル
- Older: 「Google earth = Digital earth」を再確認