Googleを取り込む。

| | コメント(0) | トラックバック(0)

ちょっと前の記事ですが。個人的に気になる記事です。


「見えなかった情報」を可視化――NII、論文300万件をGoogle検索対象に (ITmedia News)
http://www.itmedia.co.jp/news/articles/0705/25/news041.html

国立情報学研究所(NII)が4月から、国内の学術論文情報300万件のデータベース「CiNii」(サイニイ)をGoogle検索対象にした。同時に、データベースも検索エンジンが見つけやすい形に変更。一般ユーザーが論文情報にアクセスしやすくした。


最近,論文タイトルでGoogle検索すると,国内論文が多く引っかかるようになり,とても便利になりました。これはCiNiiのおかげですなんですね。この記事によると,論文データベースをGoogle検索でひっかかるように開放し,Google Scalar(学術文献の検索)とも連携したようです。


感じとしては,自分たちで,まずデータベースを構築・改善し,「Googleさん,データベースをインデックス化して検索しやすくしたので,使ってください。」という感じで取り込んだのではないでしょうか。このやり方は,Googleとの付き合い方を考える上で,非常に有効な方法だと考えられます。


各分野では,いろいろな既存の情報が保有されていて,陽の目を見ない情報や,Googleキーワード検索で簡単にひっかかってしまう情報も混在しているわけです。そういう情報を,CiNiiのようなサイトを構築し,検索エンジンと連携も可能とすることは,とてもメリットがあると思うのです。

CiNiiのデータは、マシンで情報を収集・整理するGoogleとは対照的。学者が手で書き、査読し、学会で精読し、学会誌に掲載した論文に、被引用数を手作業で確認して作っており、何人もの人が膨大な手間ひまをかけている。人の手で整理した情報にはロボット検索にはない価値がある。「キーワード検索では、周辺の分野や、他の情報との関連性が見えづらい。手作業で整理した論文情報のページには、著者や掲載誌、引用情報などが書かれているから、ここを起点にして周辺情報に触れることができる」(大向氏)。各論文情報ページにはパーマネントリンクが付いており、それぞれのページが情報ポータルになる。


Googleによって,情報を全てインデックス化されてしまう前に,自分達が必要と考えられる方法でデータベースを構築し,インデックス化するべきだと思います。そうすれば,互いに手を組むことで,検索エンジン側としてはインデックス化する手間が省け,情報を保有していた側は,検索エンジンを通してデータを公開でき,自分達の領域を守ることができるわけです。つまり,お互いにハッピーですね。


GISの分野の人たちは,空間情報を自前でインデックス化できればいいのですが,既に侵食されてきているので,難しいでしょうね。

トラックバック(0)

このブログ記事を参照しているブログ一覧: Googleを取り込む。

このブログ記事に対するトラックバックURL: http://www.tagchan.net/cgi/mt/mt-tb.cgi/101

コメントする

このブログ記事について

このページは、tagchanが2007年6月24日 17:27に書いたブログ記事です。

ひとつ前のブログ記事は「「Google earth = Digital earth」を再確認」です。

次のブログ記事は「東京アメッシュがリニューアル」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Photo album by Flickr

www.flickr.com
This is a Flickr badge showing public photos from Tagchan. Make your own badge here.

Science and You

食べログ Photo

Powered by Movable Type 4.1
人気エントリ
▼すべて表示
generated by レビュー・ポスター

フォクすけメーター

Firefox3 Meter

なかのひと