情報の科学と技術
Vol. 54 (2004), No.12
特集=最新情報検索技術
特集「最新情報検索技術」の編集にあたって
本特集では2000年の「情報検索の新潮流」以後の情報検索の変化をとりまとめ,新しい動向や,今後期待されるいくつかの検索技術を展望しています。
最近の情報検索の内外の状況を把握したい,バイオインフォマテイックスを理解したい,連想検索の仕組みを詳しく知りたい,セマンテイックWebの可能性は,検索評価の動向は……こうした要求に本特集はズバリ応えてくれます。
総論ではAsilomarレポートなどにより,データベース技術の最近の変化や課題を的確にとりまとめていただきました。また本特集の各論への言及や,さらに各論では取り上げなかったいくつかの情報検索技術も紹介していただきました。
バイオインフォマテイックスでは遺伝子情報やたんぱく質情報の解説と,生命情報データベースを紹介していただきました。
連想検索ではこれまでよく知られていなかった汎用連想検索エンジン(GETA)や,概念検索との違いなど詳しい解説がなされています。著者たちの「連想の情報学」,「新しい本・読書環境」を目指す意気込みが感じられます。
セマンテイックWebではメタデ−タを事例とした,形式言語学やオントロジーによる,Web上での語彙の意味理解を可能にする野心的な試みが紹介されています。
Web情報検索の評価ではWeb文書を対象とした検索技術の諸問題,評価ワークショップの取り組み,評価モデルを紹介していただきました。
本特集は情報検索技術を中核に分子生物学・生命情報,認知科学・創造性,言語学・意味論,検索評価法など多様な関連分野とリンクした内容となっています。まだまだとりあげるべき検索技術もあるとは思いますが,本特集が読者の皆様の実務や理論研究のお役にたてれば幸いです。
(編集担当委員:岡谷 大,上村順一,川瀬直人,野本 東,吉間仁子)
情報検索の技術動向
長塚 隆
*ながつか たかし 鶴見大学文学部ドキュメンテーション学科
〒230-8501横浜市鶴見区鶴見2-1-3
Tel. 045-581-1001(原稿受領 2004.7.15)
情報検索技術についての最近の傾向と変化についてまとめた。特に,インターネット,科学,電子商取引などの分野での情報の性質と情報源の変化と拡大に焦点をあてた。新しい情報検索技術は,マルチメディアサービス,情報商品のアグリゲーションサービス,学術データなどのデジタル化された社会情報の発展と密接に関連している。わが国における最近の情報検索技術や情報検索サービスにおける技術的な展開について解説した。
キーワード:情報検索,データベース,DBMS, マルチメディア,デジタル情報,情報検索サービス,インターネット
バイオインフォマティクス
林 博司
*はやし ひろし 愛知淑徳大学文学部 図書館情報学科
〒480-1197 愛知県愛知郡長久手町長湫片平9
Tel. 0561-61-4111内605(原稿受領 2004.9.27)
生命は二つの情報システム,すなわち遺伝情報系と感覚情報系によって支えられている。遺伝情報系では,DNA→RNA→たんぱく質というセントラルドグマに従って,情報の複製,転写,翻訳がなされている。これらの情報はすべて文字で書かれた文章と同じように1次元の情報になっている。したがって,これらの情報はコンピュータを用いて保存し,比較し,特定の文字列を検索することなどが可能である。本稿では,こうした生命情報技術の現状を纏めた。
キーワード:セントラルドグマ,エクソン,イントロン,ホモロジー検索,配列検索,たんぱく質の高次構造
連想に基づく情報アクセス技術
―汎用連想計算エンジンGETAを用いて―
高野明彦*,西岡真吾**,丹羽芳樹***
文字列検索に代わる次世代の検索技術として,連想検索などの文章の類似性に基づく検索方法が注目されている。われわれの開発した汎用連想計算エンジンGETAは高速で柔軟な連想計算を提供し,大規模なデータベースを対象とする連想検索の実現への道を開いた。GETAを活用して実装された連想検索機能は,すでにいくつかの情報検索サービスで実用化されている。
キーワード:文書類似検索,連想検索,連想計算,関連性フィードバック,特徴語,情報アクセス,連想
セマンティックWeb
―コンピュータが理解できるメタデータ―
横井俊夫
*よこい としお 東京工科大学 メディア学研究科
〒192-0982 八王子市片倉町1404-1
Tel. 0426-37-2435(原稿受領 2004.10.4)
WWWにおける情報検索を革新すると期待されているセマンティックWebの解説である。セマンティックWebは,Webページを含むすべての情報資源のメタデータをエージェントが理解できるようにし,知的な検索や高度なWebサービスを実現しようというものである。W3Cによって欧米を中心にして研究開発が進められ,メタデータを記述するためのRDFやOWLの仕様が提案され,実用化に向け各種応用の開発が進められている。セマンティックWebの目標と目的,技術の全体像,メタデータ理解の仕組について,書誌データを事例として解説する。
キーワード:セマンティックWeb,メタデータ理解,ダブリン・コア・メタデータ,オントロジー,RDF,OWL
Web情報アクセス技術の評価モデル
江口浩二
*えぐち こうじ 国立情報学研究所 人間・社会情報研究系 情報図書館学研究部門
〒101−8430 東京都千代田区一ツ橋2-1-2
Tel. 03-4212-2584(原稿受領 2004.11.1)
Web文書は,従来の情報検索が扱ってきた新聞記事,特許,学術論文などとは異なる特性を備えており,これまでWeb文書の特性を利用した様々なアクセス技術が提案・開発されてきた。Web検索はWebを対象としたアクセス技術の最も基本的なものであり,その有効性評価という点では,実用を意識した評価が難しいとされてきたが,近年,この種の問題に対処するために評価ワークショップの試みがなされているところである。本稿では,Web文書を対象とした検索技術における諸問題を概観するとともに,Web検索に関する評価ワークショップの取り組みとその方法論的基盤を与える評価モデルについて紹介する。
キーワード:Web情報アクセス,Web検索,評価モデル,評価ワークショップ,テストコレクション,TREC,NTCIR
連載:INFOPROのBOOKMARK(第9回)
ニュース情報を調べる
菊地哲也
*きくち てつや ATカーニー
〒107-0052 東京都港区赤坂1-12-32 森ビル東館32階
Tel. 03-5561-4438(原稿受領 2004.9.13)
本稿ではインターネットを通じたニュースの閲覧・記事検索に関する基本的な考えとアプローチについて紹介する。ビジネスの世界で最も基礎的な情報収集と言われているのがニュース情報の収集である。業務によって特殊化したアプローチもあり得るが,ここでは汎用性が高いと思われる情報源について紹介したい。
キーワード:インターネット,ポータルサイト,ニュース,アーカイブ,データベース,英文データベース,検索エンジン