Vol. 60 (2010), No.6
様々な業界では,データマイニングを活用した新しいサービスが展開され,対象とする顧客のニーズの掘り起こしに一定の成果をあげていると考えられます。一方,図書館や情報センターなどに目を移すと,データマイニングを活用したサービスは,あまり積極的に行われているとは言えないのではないでしょうか。今後の図書館・情報センターの発展には,利用者のニーズを掘り起こし,新しいサービスを展開することが必須と思われます。
冒頭の杉田論文では,経営学から見たデータマイニングについて述べられ,これまでのデータマイニングの手法について整理されています。また,データマイニングの長所や注意点などについて述べられ,今後の図書館・情報センターでの活用の際に有用な論考となっています。梶川論文では,リンクマイニングを用いた引用情報の活用方法や分析時の注意点が述べられています。実践例として,吉田論文,青砥論文,南論文では,図書館・情報センターでの先進的な活用事例,図書館・情報センターでの活用の今後の展開などが取り上げられています。これらの論考は,今後の図書館・情報センターなどでのデータマイニング活用に勇気を与える論考となっています。
今回の特集が,今後の図書館・情報センターでのデータマイニングの活用の一助となれば幸いです。
(会誌編集担当委員:小山信弥(主査),高久雅生,矢田俊文,服部綾乃)
杉田 善弘*
*すぎた よしひろ 学習院大学経済学部
〒171-8588 東京都豊島区目白1-5-1
Tel. 03-3986-0221(原稿受領 2010.3.19)
データマイニングとは何か。本論文では,データマイニングと伝統的な統計分析の違いを考察することによって,データマイニングの特質を明らかにする。大量のデータが簡単に手に入る現代の環境では,従来の推測統計の考え方に捕われずに,リーズナブルな費用で多くのモデルを使用することが可能になり,実務での活用を意識したデータ分析を行うことができるようになった。データマイニングはこの環境の中で育った新しいデータ分析の方法論である。実際にデータマイニングを活用するためには,一連の流れであるデータマイニングプロセスを理解する必要があるが,本論文はこのプロセスを概観し,それぞれの段階を説明するとともに,重要な概念や手法を明らかにする。
キーワード: データマイニング,データマイニングプロセス,データマイニング手法,マーケティング分析,POSデータ
梶川 裕矢*
*かじかわ ゆうや 東京大学大学院工学系研究科
〒113-8656 東京都文京区弥生2-11-16
Tel. 03-5841-1161 (原稿受領 2010.4.7)
様々なデータマイニング手法の中で,書籍や論文,特許といった文書群を扱う図書館や情報センターにおいて特に重要なのが,リンクマイニングとテキストマイニングである。本稿では,その中から,リンクマイニングを用いた引用情報の活用方法とその事例,分析時の注意点について解説を行う。活用事例として,論文や特許情報を用いた領域全体の構造の俯瞰,萌芽的領域の検出,重要な論文の予測,コーパス間の差異の抽出を行った事例を紹介するとともに,分析時において注意すべき事項,すなわち,コーパスの妥当性やリンク作成法の設定,分析のタイムラグや粒度についても解説を行う。
キーワード: データマイニング,リンクマイニング,引用分析,ネットワーク分析,ランキング,クラスタリング,構造予測,学術俯瞰
吉田 稔,中川 裕志*
*よしだ みのる,なかがわ ひろし 東京大学情報基盤センター
〒113-0033 東京都文京区本郷7-3-1東京大学附属図書館4階
Tel. 03-5841-0340(原稿受領 2010.3.24)
近年の電子的文書の増大に伴い,テキストマイニングの必要性が高まっている。テキストマイニングとは,テキストデータを対象としたデータマイニングであり,自然言語処理等の技術を用いることでテキストを加工し,データマイニング技術を適用することにより,今まで知られていなかった新しい知識を発見するための技術である。本稿では,テキストマイニングとは何かということについて簡単な解説を行うとともに,テキストマイニングに必要となる自然言語処理の紹介および,実際のテキストマイニングの応用として,筆者らが開発した検索システムUT-Kiwi,Wikiwiについて紹介を行う。
キーワード: テキストマイニング,自然言語処理,情報検索,検索支援,接尾辞配列
青砥 哲朗*
*あおと てつろう 芝浦工業大学学術情報センター事務部ネットワークサービス課
〒337-8570 さいたま市見沼区深作307
Tel. 048-687-5148(原稿受領 2010.3.25)
近年,インターネットで様々な情報が得られるようになったこともあり,正確な情報での自学や自習をする学生が減ってきている。また,学生が自身の履修する講義に対し,どのような本を選び,自学するかの情報が不足していることも否めない。これらのことは図書館の利用率の減少にもつながっていると言える。そこで著者らは,図書館の利用率をあげることを目的に,書籍をレコメンドするシステムを構築することとした。本報告では,学生に身近なシラバスの情報をもとに書籍をレコメンドするシステムを構築し,これを評価している。
キーワード: TermExtract,Nグラムモデル,シラバス,レコメンド
南 俊朗*
*みなみ としろう 九州情報大学経営情報学部,九州大学附属図書館研究開発室
〒818-0117 福岡県太宰府市宰府6-3-1
Tel. 092-928-4000 (原稿受領 2010.4.8)
図書館学の五法則にも謳われているように図書館は時代に合った利用者サービスを求めて変わり続けなければならない。現在進行している高度情報化社会への流れは,携帯電話などによるネットワーク情報端末の進化によってもたらされたものである。このような社会変化やそれに伴う利用者の変化に図書館が対応し続けていくためには,マーケティングの手法を取り入れ,利用者の要望に従来以上に応えられる態勢を構築する必要がある。本稿では,図書館マーケティングに関して,概念の定義や手法開発へのアイディアなどを示し,その重要性を訴える。今後有益な手法を具体的に開発し,将来の図書館にとって核となるサービスモデルを構築しなければならない。
キーワード: データ解析,データマイニング(DM),サービスマーケティング,図書館マーケティング,電子社会,利用者指向