情報の科学と技術
Vol. 53
 (2003), No.11
特集=新聞情報


特集「新聞情報」の編集にあたって

 新聞は,文献 (雑誌) や書籍と同様に,情報センターや図書館内の資料として無視できない存在です。しかしながら,新聞から得られる情報の整理の方法は,一般の書籍や逐次刊行物情報とは大きく異なっています。新聞を記事単位で切り抜き,台紙に貼り,発行日付の記入や元記事掲載紙名の記入,記事概要などの記入というインデクシングをし,利用者あるいは業務・事務用として回覧に付す。「スクラップ」,あるいは「クリッピング」と言われる非常に細かい作業を,毎日のように情報センターや図書館で行っていることと思います。
 新聞記事は通常,ニュースリリース,通信社配信記事,新聞社記事に分けることができ,新聞社記事には,直接取材,間接取材,通信社配信などさまざまな情報源から成り立っています。クリッピング作業者は,新聞という大部な冊子体から,この差異を意識的,あるいは無意識の内に判断して取り出しているはずです。人間が行っていたクリッピングや概念検索,フィルタリングを,機械がいかにして行えるのか,またそのような検索技術の動向などを御紹介します。
 翻って,あらゆる資料がデジタル化される昨今,新聞においてもデジタル化の波が押し寄せて来ています。記事データだけでなく,画像データにおいても同様です。そのような中で,写真を汎用webブラウザで無料でかつ自由に検索できる技術は注目すべき存在だと言えるでしょう。稼動中の写真画像データベースシステムの概要,運用などに焦点を当ててみました。
 さらに,新聞特有の構造を利用し,新聞記事の電子的構造化に取り組む事例もみられたり,クリッピングを紙ベースで行っている時には見えにくかった,記事単位の著作権処理の問題なども起こりつつあります。また,新聞デジタル化の流れは,海外と国内では,相当の温度差があります。国内を概観する上で,海外事情は大いに参考になることでしょう。
 デジタル化時代の新聞クリッピングに関わる情報を整理し,今後の作業に供すべく,特集を編んでみました。
(会誌編集委員会特集担当委員:上村順一,伊藤 淳,岡谷 大,北島由紀子,茂出木理子)

目次に戻る


総論:ディジタル化時代の新聞切り抜き業務とは
後藤嘉宏* 
*ごとう よしひろ 筑波大学図書館情報学系
 〒305-8550 茨城県つくば市春日1-2
 Tel. 0298-59-1322(原稿受領 2003.8.20)

 ディジタル化時代の新聞では,記事のデータベース利用が増え,また速報記事が増すことで,記事が価値から離れ,事実の報道が尊ばれる。データベース利用される記事は,新聞紙面上の記事と異なり,何面に記事があるか,見出しの大きさがどの位あるかといった価値づけから解放される。その意味で検索者が 主体的に個々の記事に臨める。しかしこれらの記事は,記事の置かれた背景や文脈を失う。各種データベースが充実しているディジタル化時代においても,新聞切り抜き業務が存在している理由も,このような記事の置かれた文脈・背景を重視し,さらにそれらを切り抜きのイメージ情報によって思い出す点に関係し よう。

キーワード:新聞切り抜き,記事データベース,価値,文脈,イメージ情報

目次に戻る


新聞記事の検索支援システム
松井くにお*,橋本三奈子**,内野寛治*
*まつい くにお,うちの かんじ (株)富士通研究所言語処理研究部
 〒211-8588 神奈川県川崎市中原区上小田中4-1-1 Tel. 044-754-2671
**はしも とみなこ 富士通(株)DBサービス部
 〒144-8588 東京都大田区新蒲田1-17-25
 Tel. 03-3730-3155(原稿受領 2003.9.1)

 新聞記事の情報検索は,人手で付与する統制語やフリータームの自動抽出,N-gram文字インデックスなど,検索システムの速度向上や運用コストを抑える 手法が提案されてきた。また,検索の精度を上げるための工夫として,システムと利用者が対話的なやりとりを行う検索支援のしくみも提案されている。本論 文は,新聞記事を対象とした検索サービスの現状を述べ,大量な情報と豊富な語彙のために生じる課題を克服するための検索支援機能について,今までどのよ うな試みがなされてきたか,今後どのような活用がなされていくのかについて述べる。

キーワード:検索支援,統制語,豊富な語彙,フリーターム自動抽出,N-gram文字インデックス

目次に戻る


毎日新聞における「毎日フォトバンク」の運用
小田切敏雄*
*おだぎり としお 毎日新聞東京本社編集局情報調査部
 〒100-8051 東京都千代田区一ツ橋1-1-1
 Tel. 03-3212-0161(原稿受領 2003.8.14)

 毎日新聞は日本最古の全国紙で,保存している紙焼き写真のデータベース化を1987年から着手し,約36万枚以上をデジタルベース化しており,そのうち約 20万枚を社外公開して関係者に提供している。また日日の毎日新聞掲載写真もその日のうちにデータベース化している。本原稿は「毎日フォトバンク」の構築 から現在の運用までを技術面と具体的な作業面から紹介するものである。

キーワード:毎日フォトバンク,MAIHIT(マイヒット),データベース化,PanaSearch,サムネイル,書誌情報,MainichiINTERACTIVE,写真データベー ス,報道写真

目次に戻る


新聞記事の電子的構造化―NewsMLによる次世代ニュース管理―
井上 明*
*いのうえ あきら 甲南大学 情報教育研究センター
 〒658-8501 兵庫県神戸市東灘区岡本8-9-1
 Tel. 078-435-2570(原稿受領 2003.8.15)

 新聞記事は,限られた紙面の中へ多くの情報を書き,人が理解しやすい内容で伝える,という前提から,文章構造が定型化され,いわゆる「5W1H」が記事 に盛り込まれている。さらに写真や画像が内容を補足する構造になっている。 本論文では,XMLを基本技術として新聞記事の構造とニュースに付帯する情報を電子化するNewsMLに注目し,NewsMLの概要,成り立ちとその特徴を明らか にする。また,わが国におけるNewsMLの適用事例から,NewsMLがもたらすメディア変革の可能性について考察する。NewsMLは,データ共通化による業務効率 化という側面だけでなく,社会事象のデータベース化による多方面からの情報検索や分析への応用が期待できる。

キーワード:NewsML,XML,ニュース,新聞記事,データマイニング

目次に戻る


図書館における新聞記事電子化の著作権問題
中田彰生*
*なかだ あきお 毎日新聞社知的財産管理センター
 〒100-8051 東京都千代田区一ツ橋1-1-1
 Tel. 03-3212-1308(原稿受領 2003.8.21)

 新聞記事クリッピングの電子化に関する著作権問題を考えるに当たり,まず新聞記事が法律上の保護を受ける著作物であることを明らかにした。さらに,過去40年間の新聞社の著作権に対する意識の変化をたどり,新聞社の側から見た電子的クリッピングの問題点を考察した。問題の一つはデータベース・サービスなどの新聞社のメディア事業との競合であり,さらに犯罪記事などの関係者の人権に関しても配慮が必要であることを示した。こうした問題を解決するには,関係団体の間で積極的に意見交換していく必要がある。

キーワード:新聞記事,クリッピング,データベース,人権

目次に戻る


新聞デジタル化の海外事情
松本賢司*
*まつもと けんじ 日本経済新聞社
 〒100-8066 東京都千代田区大手町1-9-5
 Tel. 03-5255-2100(原稿受領 2003.9.9)

 「IT革命」であらわされる情報通信分野の技術革新は,成熟産業といわれる新聞メディアにも大きな影響を及ぼしてきた。新聞編集・製作技術への適用で 始まったデジタル化の流れは,結果として新聞記事情報の電子的な蓄積へとつながり,ここ数年のインターネットの爆発的普及も相まって,今やメディアとしてのあり方をも左右しつつある。本稿では,検索エンジンによるニュースサービスなど新たなメディアの動向について紹介するとともに,海外における新聞デジタル化,特に米国および英国新聞各社がインターネットを介した情報提供にどのように取り組んでいるかについて具体的事例を交えて概観する。

キーワード:新聞メディア,WEBサービス,インターネット,デジタル化,情報検索

目次に戻る