第235回 ライフサイエンス分科会
記入者:渡辺 正彦
開催日時: 2006年3月16日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 「Online Information 2005」、「BioMed Centralについて」等
参加人数: 15名
内 容:勉強会「海外のライフサイエンス関連情報の最新動向」
今月は、(財)国際医学情報センター佐藤さんに昨年ロンドンで開催されたOnline Information 2005の 参加報告をしていただき、サンメディア(株)松下さんにBioMed Centralとオープンアクセスを紹介していただきました。
1.Online Information 2005
(財)国際医学情報センター 佐藤 京子 氏
① Open Remarks
David Weinberger氏が”The Shape of Knowledge”と題して、インターネット時代の情報利用について講演された。 インターネット時代になり、情報をシンプルに概念分類してフィルタリングすることは「死んだアイデア」に なってしまった。インターネット時代は違う意見をもった人々が一緒に話をできる時代であり、Best Informationを 求める時代からGood Enoughな情報を得る時代になった。世界中の人々が興味あることを話して、探す時代になった。
② Google Scholar
賛否両論の議論があった。その中で、GoogleのJohn Needam氏がScholarプロジェクトは文献を無料で提供することが 目的と述べたそうで、意外に思いました。
③ Connotea
Nature Publishing Groupは、PubMedやAmazon、HighWireで参照したサイトをリスト化できるConnotea( http://www.connotea.org/)というサービスを開始した。 研究者同士でサイトの共有化ができ、インパクトのあるサイトを見つけることができます。 同様なサイトとして、CiteULike (http://jp.citeulike.org/ )があります。研究者同士の情報評価サイトとして興味がもたれます。
2.BioMed Centralについて
サンメディア(株) 松下 茂 氏
① BioMed Central
2001年に英国のCurrent Science Groupにより創設されたオープンアクセス出版で、BMCシリーズ 61誌を始め、 一部有料を含めた約180誌をオープンアクセスで提供している。PubMedに収録されることで認知度が上がり、 一部はImpact Factorの対象誌にもなっている。著作権が著者にあるので、論文を自由にWebサイトで公表したり、 引用したりできます。昨年、京都大学で開催された図書館シンポジウムでの紹介ビデオの上映もありました。
② オープンアクセス
オープンアクセス(OA)とは、学術論文をインターネット上で無料で公開し、自由にアクセスさせる環境、 運動であり、出版の一形態です。OAには、純粋なOA誌以外にも、大学・研究機関によるリポジトリ (DspaceやCALTECHなど約650期間)や既存学術雑誌のOA化(HighWire Pressの学協会誌など)もあります。 最近の動向としては、研究者によるオープンアクセス投稿、IFLAやSPARCによるOA支持、NIHからの呼びかけ、 一部出版社のリポジトリ許諾や部分的OA化があります。
③ Faculty of 1000
世界中の約4,000名の研究者が評価した注目文献について、書誌情報や抄録、研究者の評価を収録している システムです。本邦からも約60名参加しています。BiologyとMedicineがあります。Medicineについては、 次のサイト参照してください。 http://www.f1000medicine.com/about/
第234回 ライフサイエンス分科会
記入者:固武龍雄、齊藤真紀子、戸上康弘、藤島嘉幸、堀恭子
開催日時: 2006年2月16日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 参加各位の資料
参加人数: 15名
内 容:勉強会「投稿原稿の最終確認とJDreamIIの情報交換」
今月は、4月から本稼動するJDreamIIについて各自の使用経験を基に情報交換しました。3名からの報告を列記します。その後、投稿論文の最終確認を行いました。
1.JDreamIIの情報交換
1) JDreamIIを実際に使用した上での、不具合や不便と感じる点を報告した。
①旧JOISシステムでは可能であったのに、JDREAMIIになって出来なくなったこと
「/AL」フィールドで検索した場合、英文表題「/TIEN」、日化辞番号「/SN」フィールドが含まれない。
「/TIEN」フィールドで「A」を検索できない。
SDI検索式を呼び出して検索を実行することができない。
②その他
化学物質名「/CNS」と準シソーラス「/STS」フィールドでも、「/AL」を使うことにより近接演算子が利用可能(仕様がマニュアルと異なる)。
薬剤名を検索する場合に、JCHEMからJSTPlusやJMEDPlusへの渡り検索時に「/AL」フィールドで検索結果を反映させることができない。
タイムアウトした場合にそのセッションの料金表示ができない。
JSTPlusとJMEDPlusのマルチファイル検索時に件数表示の段階では重複除去されていない。また、その件がマニュアルに記載されていない。
「/CN」「/SN」フィールドでの検索結果の件数がJOISの結果と異なる。
同義語辞書の内容が不十分(英語名が全く展開されない等)。
2) JOISと比較したJDreamIIの特徴として16点ほどリストアップし、その中でも特徴的な次の2点について事例を挙げて説明した。
① 検索システムの違い
JOISでは切り出し語による検索のため、抄録中に出現していても不要語処理されて検索対象とならない言葉があったのに対して、 JDreamIIではストリングサーチ(中間一致、全文検索)がメインとなるため、ノイズ(不要な検索結果)をヒットさせやすくなる。
「EPO」、「CT」、「イチョウ」、「サージ」など英数字・カナ文字での語数の短い検索語はもちろんのこと、「Phase I」、「小細胞癌」など、 検索語の前後に別の言葉が付加されるとまったく意味が異なってしまうケースも考慮しなければならない。
例として、「Phase I」を検索してみたところ、「Phase II」、「Phase inversion」、「Phase immunoassay」などもヒットした。
②近接演算子のマスク文字のフィールドによる違い
JDreamIIでは、英文フィールドと和文フィールドとでは近接演算子のマスク文字の捉え方が異なる。英文フィールドで(2w)と指定すると、 2単語までマスキングできる(単語単位)。和文フィールドで(2w)と指定すると、2文字までマスキングできる(文字単位)。
例えば、TIENでは、Percutaneous(2W)Angioplastyで、Percutaneous Transluminal Coronary Angioplastyを検索することができるが、 和文標題・和文抄録では、Percutaneous(2W)Angioplastyと入力しても、PercutaneousとAngioplastyの間には2文字しかマスキング されないため、Percutaneous Transluminal Coronary Angioplastyを検索することができない。Percutaneous(S)Angioplastyと入力する方が 無難である。
JDreamIIでは、TIENはデフォルトの検索フィールドではないので、「Percutaneous(2W)Angioplasty/TIEN」と検索フィールドを指定しなければ、 英文標題は検索できなかった。
L1 SEARCH Percutaneous(2W)Angioplasty 0
L2 SEARCH Percutaneous(2W)Angioplasty/tien 60
L3 SEARCH Percutaneous(S)Angioplasty 10
3) JDreamIIを使用して気付いた点を報告した。
①JCHEMファイルからの渡り検索がJOISのようにうまく機能していない。
物質名(CN)で検索した集合をCN指定で頻度分析すると、化学物質名の一覧が出る。これを「検索入力エリアに反映」のボタンを押すと、ボックスに入りきらない時がある。(制限値が半角2048文字以内のため。)
網羅的な検索をしたい場合は、日化辞番号(SN)も渡り検索を行なう必要あるが、 以前のように、CN、SN同時に抽出した後に、一挙に 「S E1-En/AL」のコマンドで検索できない。同様の操作を2回行なう必要がある。
②マルチファイル検索は便利になったが、ファイル毎に検索料金がかかるので注意が必要。
③ストリングサーチは、適用ファイルや適用フィールドが拡大され絞込み検索などに便利になった。 (→その反面ノイズを拾うことは多くの方の発表で出ていました…)
④頻度分析は他の日本語文献データベースにない機能でJOISを踏襲して継続したことは評価できる。
⑤JICST分類コードが一覧で見られるようになった。 (→全てのコードを厳密にふっているわけではないので、もれのない検索をする際には これのみで検索を済ませてはいけないとの指摘がありました。)
⑥色使いやボタンの位置など、まだWebデザインの完成度は高くないので今後改良が必要。
2.「情報の科学と技術」投稿論文の最終チェック
1月のOUGでの検索事例や指摘事項を補筆した原稿の読み合わせを行った。RSSの紹介については、My NCBIとの違いを十分に理解していないので、原稿には記載せずに、HPで紹介することにした。今回の議論を踏まえて、原稿を補筆・校正後、Infostaに送付することにした。
第233回 ライフサイエンス分科会
記入者:齊藤真紀子、固武龍雄、藤島嘉幸、石神祥子、青木妙、 堀恭子、石井恵子
開催日時: 2006年1月19日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: PubMed検索事例、投稿原稿の確認等
参加人数: 14名
内 容:勉強会「PubMedの検索事例と投稿原稿確認」
今月は、PubMedと商用のMedlineを比較した検索事例を持ち寄り、Infostaから依頼の原稿に追加する内容 について検討しました。
1.PubMedの検索事例
① 1998年以降の高齢者のうつ病に関する総説文献の第一著者名ランキング
DIALOGでは、第一著者名に限定したランキングが出来ないが、PubMedでは第一著者名に 限定したランキングが可能である。PubMedが有効に利用できる事例の一つである。
② 薬剤による胃石の発症に関する文献検索
「薬剤による胃石の発症に関する文献」について「PubMed」と「Dialog Medline」で検索し 過程や結果の比較を行った。キーワード「bezoars(胃石)」のMeSHがあるかを確認し、次に キーワードと副作用のサブヘディングを掛け合わせて検索した結果、二つのデータベースの ヒット数に大きな差は無かった。
PubMedでは、MeSH DataBaseでMeSHの確認が出来、そのまま検索できるのが利点である。 MeSHは階層構造になっていてわかりやすい。MeSHに関連するサブヘディングで絞り込むことが 出来る。またサブヘディングは下位概念のものも含んでいる。 (今回のBezoarsはサブヘディングのAEとリンクしないので、”Bezoars AND AE”で検索。)
Dialog Medlineでは、まずMeSHを冊子体で確認しなければならない。 そしてディスクリプタやサブヘディングを入力するために、システム独特のコマンドを 確認し利用する必要がある。
単純な検索の場合、検索技術が未熟な利用者にはPubMedは扱いやすいと感じた。
③ イオン性造影剤の検索(non-ionic contract media)
PubMedではノイズが多く出て、使いにくい例を示した。
イオン性造影剤を検索する場合に、Contrast Mediaのほかに単にionicと入力すると、 non-ionicから切り出されたionicによって、non-ionicの文献も検索されてしまう。 “NOT non-ionic” とすると、両方が記載されている文献がもれてしまう。このノイズを 除くためには、NOT近接演算子が使える商用システムのMEDLINEを用いるのが良い。 この例では判定をしやすくするためにionicはタイトル中のタームに限定した。 “ionic/TI(NOT N)non”とした。
PubMedでは、はじめの6件中4件もノイズであった。DIALOGのMedlineでは、はじめの6件は 全件該当で、ノイズはなかった。
④ PubMedとOVID Medlineで「小児」を検索した比較
PubMedと商用Medlineのトランケーション機能を比較すると、商用Medlineでは トランケーションの文字数指定ができるのに対し、PubMedではできない。 PubMedでフリータームを使った検索の際(網羅性を重視する際など)に、トランケーション(*)が 使えないため、想定される語尾変化を検索式に組み込まなければいけないなど、商用Medlineを 使い慣れた者にとっては、検索式作成に余計な手間がかかる場合がある。
たとえば、小児(KID)を検索する場合に、商用Medlineでは「KID$1(OVID Medlineでの1文字以内の トランケーション指定)」で指定できるが、PubMedだと「KID*」ではなく「KID OR KIDS」に しなければいけない。
⑤ PubMedで褐色脂肪組織及び白色脂肪組織の検索した場合のAutomatic Term Mappingの 事例
白色脂肪組織(White adipose tissue)と褐色脂肪組織(Brown adipose tissue)の変換例
“brown adipose tissue”で検索すると、下記検索式に自動変換される。
(“brown fat”[TIAB] NOT Medline[SB]) OR “brown fat”[MeSH Terms] OR brown adipose tissue [Text Word]
“white adipose tissue” で検索すると、下記検索式に自動変換される。
(“adipose tissue”[TIAB] NOT Medline[SB]) OR “adipose tissue”[MeSH Terms] OR white adipose tissue[Text Word]
※”Brown Fat” は “Adipose Tissue” の下位に存在しているので、ATMを用いると白色脂肪組織に 限定されず、褐色脂肪組織も含めて脂肪組織全部が検索されることになる。 ⇒ 限定したい場合は “white” と掛け合わせて検索するほうがよい。
褐色脂肪細胞(brown adipocyte)と白色脂肪細胞(white adipocyte)での変換例
“brown adipocyte” で検索すると、”brown” と “adipocyte” は別々にマッピングされる。
brown ⇒ (“ocular motility disorders”[TIAB] NOT Medline[SB]) OR “ocular motility disorders”[MeSH Terms] OR brown[Text Word]
adipocyte ⇒ (“adipocytes”[TIAB] NOT Medline[SB]) OR “adipocytes”[MeSH Terms] OR adipocyte[Text Word]
“brown” は眼球運動障害(ocular motility disorders)にマッピングされてしまう。これは このMeSHタームのEntry TermにBrown Tendon Sheath Syndromeがあるためか?
“white adipocyte” の検索でも別々にマッピングされる。
white ⇒ ”european continental ancestry group”[MeSH Terms] OR white[Text Word]
2004年以降MeSHの “white” は “european continental ancestry group”に、”black”は “African Ancestry Continental Group” に変更されているが、Entry Termとして設定されて いるためマッピングしている。 ⇒ ノイズを避けるには “brown” や “white” はマッピングさせないほうがよい。
また、近接演算子を使える商用Medlineの方が精度の高い検索を行えると考えられる。
⑥ 「心筋炎の治療(2005年以降)」、「カルチノイドに対する抗癌剤ダカルバジンの効果」 をPubMedとOVID Medlineを検索して比較
MeSH、サブヘディング、フリーキワードを用いて、同一検索式を作成し検索したところ、 両データベースで同一件数の結果が得られた。
PubMedも、MeSHやサブヘディング使用できる点が有効。これらを使えば、エンドユーザーでも 精度高い結果を導くことが可能。そのために、エンドユーザー教育時には、MeSHの存在、 サブヘディングの知識、トランケーションを理解してもらう必要がある。
2.INFOSTA会誌依頼のドラフト原稿チェック
INFOSTA掲載予定の無料データベースに関する原稿のドラフトを読みながら参加者全員で内容を 検討した。PubMedについては、前半の事例検討で発表された内容を盛りこむこととなった。 iyakuSearchについては、いくつか修正案・疑問などが提示されたので、再度内容を検討して 修正をすることとなった。
PubMed追加内容
近接演算が出来ない
トランケーションで文字数指定が出来ない
第一著者の指定ができる
第232回 ライフサイエンス分科会
記入者: 渡辺 正彦
開催日時: 2005年12月15日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 医中誌Web「Ver.4」のご紹介、別紙資料など
参加人数: 13名
内 容:勉強会「医中誌Web ver.4の紹介」
今回は、医学中央雑誌刊行会の松田氏に来年リリース予定の医中誌Web ver.4について紹介して いただきました。また、固武さんからPubMedの検索事例の紹介とInfostaから依頼の原稿作成方法について の打合せを行いました。
1.医中誌web ver.4の紹介
医学中央雑誌刊行会 松田 真美氏
ver.4について、開発中のADVANCED MODEでのデモを交えて、新機能の内容と今後の予定について 紹介していただいた。
① 主要なバージョンアップ内容
オリジナル文献入手の支援機能の追加:オンラインジャーナルや図書館所蔵情報へのリンク ⇒ 今回最も注力した機能
クリップボード機能や書誌確認画面の追加
検索結果の詳細表示や印刷方法の改善
② 現状と予定 (12月15日現在)
現在、BASIC MODEをテスト公開
2005年中にADVANCE MODEもテスト公開予定
2006年1月末から2月中旬に第一弾のリリース
③ 電子ジャーナルへのリンク
Medical Online、PubMed、CrossRef、PierOnlineへのリンクすることにより、オリジナル文献の入手を可能とした。 CiNiiへのリンクは第2弾で実施(6月を予定)。Medical Onlineへは400誌程度リンクされているので、表示される ことが多い。電子ジャーナルとのリンクは月1回更新する予定。
④ 管理者画面でのデフォルト設定
タイムアウト時間(ただし、履歴は1時間程度保存している)、検索対象年、1ページあたりの表示件数、 電子ジャーナルへのリンク表示等を設定することが可能。
⑤ 検索結果の詳細表示、印刷、保存
複数ページの結果を選択可能。ver.3とは異なり、全件を表示や保存したい場合は、すべてにチェックを 入れる必要がある。表示や保存件数の上限は未定。印刷アイコンをクリックした後で、印刷形式の変更も可能。 医中誌CD-ROM形式は中止する方針。
⑥ ログの閲覧
管理者画面にアクセスログの閲覧ページを包含した。
⑦ その他
ADVANCED MODEとBASIC MODEで機能に大きな差が無く、ADVANCED MODEをメインに利用してもらうことを考えている。 BASIC MODEについては、もっとユーザーフレンドリーな画面にしていくことも考えている。
テスト公開中に設定した内容は本番環境に移行。
検索履歴の一部を削除する機能を付加。
タイトル表示画面で抄録の有無を確認できるようにする。
書誌確認画面は第二段階以降にリリース。
⑧ SDIサービス
仕様が固まっていないとのことで、意見交換を行った。
2.PubMedの検索事例の紹介
固武 龍雄氏
副作用の検索において、adverse effectsと複数形で入力した場合と、adverse effectと単数形で入力した場合で、 automatic term mapping処理が異なるためヒット件数が大きく違ってくる。エンドユーザーに教育する際に注意が 必要。
Adverse effects ⇒ subheadingの“adverse effects”も検索
Adverse effect ⇒ adverse AND effectと検索 (ヒット件数少ない)
3.Infostaからの無料DBについての原稿依頼
PubMedとiyakuSearchを紹介する。IyakuSearchについては、JAPICのOUGメンバーにも執筆してもらう。
第231回 ライフサイエンス分科会
記入者: (株)サンメディア 堀 恭子
開催日時: 2005年11月17日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 参加者各位の作成資料
参加人数: 10名
内 容: 無料DBについての情報交換
今回も前回に引き続き無料で公開されているDBについて情報交換しました。
■ iyakuSearch
1.はじめに
iyakuSearchは、(財)日本医薬情報センター(Japan Pharmaceutical Information Center 略称:JAPIC)が2004年10月からWeb上で提供する国内外の医薬品情報に関するデータベースである。 提供する情報は、(1)医薬品文献情報、(2)学会演題情報、(3)医薬品の安全性に関する海外規制措置 情報(略称JDM)、(4)添付文書情報、(5)臨床試験情報である。このうち、文献データベースは(1)と (2)で、(1)はJOIS、e-InfoStreamから「JAPICDOC」という名称で、(2)はe-InfoStreamから「SOCIE」 という名称でおのおの有料でも提供されているが、iyakuSearch では、検索と検索結果の書誌事項 表示は無料で利用できる。抄録表示の利用にはiyakuSearchユーザー登録が必要で、登録料は年1万円 である。JAPIC維持会員に所属する人は無料で登録できる。
JOIS、e-InfoStreamから有料で提供されているデータベースとの差別化のため、iyakuSearchは、 JAPICDOC、SOCIEの特徴である詳細な索引フィールドを使ったきめ細かな検索機能をもたせていない ようである。さらに抄録表示が登録制で利用に制限があるが、国内の医学薬学分野の文献データ ベースがだれでも無料で利用できるようになった意義は大きいと思われる。画面構成がわかりやすく、 初心者でもすぐに操作できるのが特徴である。
2.概要
iyakuSearchに収録されている医薬品文献情報データベースは、1996年から現在までの雑誌論文約12万件 を収録している。採択対象雑誌は国内誌約350誌、海外誌15誌である。収録年代は順次遡って1983年からの データを搭載予定である。学会演題情報データベースは、1996年から現在までの学会発表演題約30万件を 収録している。国内開催の約4500学会の学会発表演題を収録対象としており、地方学会の演題もここで探して みると見つかることが多い。収録年代は順次遡って1993年からのデータを搭載予定である。iyakuSearchでは この二つのデータベースを横断的に検索することもできる。
検索画面は、通常の画面とエキスパート検索の画面とがある。いずれも入力コマンドは不要で、テキスト ボックスに検索語を入力する。また記号文字(AND・・・*、OR・・・+、NOT・・・#)を使ったブール演算も 可能である。PubMedと同様、タイトル、抄録、索引語、著者名、所属機関のすべてのフィールドが検索対象 となり、検索時にフィールドを限定することができない。絞り込み項目として、年月、副作用記述の有無、 記事種類(原著、 総説、 欧文(国内文献)、海外文献)、対象(ヒト、動物)がある。検索結果の履歴を 保存する機能もあるが、PubMedのような履歴を用いた検索をすることはできない。
エキスパート検索画面にはさらに「入力支援機能」が備えられている。これは検索語の候補語表示を行ない、 検索語入力を補う機能である。入力支援項目は次の通りである。医薬品索引、薬効分類一覧、薬効補足一覧、 疾病索引、副作用索引、器官別副作用一覧、剤形一覧、投与経路一覧、会社名リスト、雑誌名リスト、 医薬文献キーワード、学会演題キーワード、学会名索引。
検索結果表示は、一覧表示、抄録表示、詳細表示の3とおりがあり、一覧表示(書誌事項の表示)は 無料である。検索結果を印刷する機能はあるが、データをダウンロードすることができない。
3.有料データベースとの比較
JAPIC作成の医薬品文献情報データベースの特徴は、医薬品の有効性、安全性という観点からデータベース 製作者が独自に作成した抄録の収録と副作用、剤形、投与経路等の詳細に区分されたフィールドでの索引づけ といえる。iyakuSearchでも抄録表示に利用制限はあるが、抄録部分も検索対象となっているのは、有料データ ベースと変わりがないが、JAPICデータベースの大きな特徴である詳細に区分されたフィールドに限定した形で 検索を行なうことができない。その点から、検索の精度に関して有料データベースと違いが生じる。
また、JAPIC作成の医薬品文献情報データベース(JAPICDOC)では、JOISでもe-InfoStreamでも、英文字表記で 検索しないと検索のもれが生じてしまうが、iyakuSearchでは、カタカナ表記でも検索が可能となっている。 IyakuSearchには、PubMedや医中誌Webのようなフリーキーワード(自由語)から統制語への自動マッピング機能は ないので、検索語を網羅的に入れて検索する場合には、エキスパート検索の「入力支援機能」を活用して検索語を 入力するといい。「入力支援機能」は、iyakuSearchでの検索以外でも、検索語の集合を作成する際に、参考になる。
■ PubMed(続)
前回に続いてPubMedを使って、医薬品に副作用をリンクさせた形での入力方法についていろんなパターンで 試してみた。副作用関係のサブヘディングの階層構造についてもあらためて確認した。
■ 臨床試験データベース
11月に開催されたジー・サーチによるDialog UPDATE2005のセミナーで海外の臨床試験データベースが紹介された。 現在、臨床試験情報を掲載する無料のWebサイトは複数あるが、2005年9月、国際製薬団体連合会(IFPMA)により 臨床試験にポータルサイトが開設され、複数のWeb(Clinicaltrials.gov、controlled -trials.com、centerwatch.com) の情報を横断的に検索することができるようになった。
第230回 ライフサイエンス分科会
記入者: (株)サンメディア 堀 恭子
開催日時: 2005年10月20日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 参加者各位の作成資料
参加人数: 14名
内 容: 無料DBについての情報交換
1.PubMed
今回は無料で公開されているDBについて情報交換しました。
■ はじめに
PubMedは、医学分野では最も代表的な文献データベースである米国医学図書館(NLM)作成の MEDLINEを中心に収録した無料データベースです。複数の検索システムから有料で提供されている MEDLINEと比較して、PubMedは、無料のデータベースとはいえ、検索機能、出力形式、出力件数等 について格別な機能制限は設けられておらず、インターネットに接続されている環境があれば、 ブラウザを通じて、世界じゅうの医学文献を収録したデータベースを自由に検索することができます。
1997年に無料公開されてから、広く利用されるようになったと思いますが、PubMedが、検索方法 等を充分理解した上で活用されているかというと疑問が残ります。またPubMedの検索機能は、医師、 看護師、研究者などエンドユーザーの方が検索の専門知識がなくてもすぐに検索できるように開発 されているため、商業データベースのMEDLINEの検索に馴染んでいるインフォプロにとってはかえって 使いづらい面もあります。
私たちインフォプロは、エンドユーザー向けにPubMedの利用方法を説明する機会も多いと思います ので、あらためてPubMedの検索方法について検討してみました。
■ 自動マッピング機能(Automatic Term Mapping)
PubMedは検索の予備知識のないユーザーでも検索できるように工夫されています。 そのためのしくみが、自動マッピング機能(Automatic Term Mapping)です。自動マッピング機能 とは、ユーザーが入力した語句について、検索システム側で統制語や雑誌名、著者名等の適切な 語句に自動的に置き換え、フィールドを解釈して検索する機能です。自動マッピングの際には、 3つのテーブル(MeSH 変換表、雑誌変換表、著者索引)を順に参照していきます。
自動マッピングの二つの機能: (1)統制語等へのマッピング (2)フィールドのふりわけ
■ フィーチャータブの活用(Details)
PubMedがユーザーの入力した検索式をどのように解釈しているかは、検索語を入力する クエリーボックスの下に並んでいるフィーチャータブの中の「Details」タブをクリックすると 確認することができます。次の例でもわかるように、常に「Details」を確認することが大事です。
■ PubMedの落とし穴と回避方法(1)
いくつかのフレーズ(例えば、cardiac failure)を入力すると、主題で検索しようとして いたのに、自動マッピング機能により「雑誌名」に解釈されてしまうという問題がありました。 この問題は、今年の10月に改善され、現在では「cardiac failure」と入力しても主題検索として 解釈されます。ただし、cardiacとfailureのAND検索となってしまいますので、フレーズとして 検索したい場合は、”cardiac failure”と入力します。
検索語の前後をダブルクオーテーションで括ると、自動マッピング機能は働かなくなります。 その他に、検索語の後にトランケーション(*)をつける、キーワードの後にタグをつけることに よって自動マッピングをストップさせることができます。
■ PubMedの落とし穴と回避方法(2)
文献データベースのフィールドには、(a)主題を表すフィールド(タイトル、抄録、索引語等)と (b)書誌事項を表すフィールドがありますが、PubMedでは、エンドユーザーがフィールドを指定し なくとも、適切な検索ができるようにしくみになっています。ただし、それが常に適切に解釈される とは限りません。適切にフィールドのふりわけができなかった場合は、(a)と(b)の全フィールドを 対象に検索しますので、お酒のシャンパン「champagne」を検索したつもりが、著者「Champagne」も 検索してしまいます。お酒のシャンパンを検索したい場合は、champagneの後に[TW]というタグを つけると、著者名や所属機関での検索を回避できます。
■ MeSH Database/Journal Database からPubMedの検索へ
PubMedは、Entrezという統合型分子生物学データベースの一部です。同じくEntrezに搭載されて いるMeSH DatabaseやJournal Databaseで、MeSHタームや雑誌名を確認し、そのままPubMedで検索 する方法を実際に行なってみました。MeSH Databaseでは、MeSHにリンクできるサブヘディング (副標目)を確認することができ、さらにチェックボックスにチェックをいれて、MeSHタームに サブヘディングをリンクした形の検索式を生成することもできます。
■ Single Citation Matcherの活用
書誌事項を確認したい場合は、Single Citation Matcherを使うと、フィールドやタグを意識する ことなく、簡単に調べることができます。また、雑誌名や著者名は一部を入力すると候補語がプル ダウンメニューで表示されるようになっています。
■ 有料のMEDLINEとの比較
PubMedのメリットは、(1)Reviewの件数が一目瞭然 (2)First AU限定、AU並び替え可能 (3)速報性 (Pre-MEDLINEのデータ)(4)フルテキストへのリンク が挙げられます。
一方のデメリットは、アクセススピードです。インターネット環境のため、サーバトラブルや アクセス集中による影響などがあります。
今回の検討によって、PubMedが、いかに様々な検索機能を備えているかをあらためて確認すること ができました。
2.その他の無料のデータベース
■ 愛知医科大学の「インターネット:医学情報を探す」
医学情報のソースが文書にまとめられています。
http://www.aichi-med-u.ac.jp/micl/kougi/20041129igaku/20041129suppl.doc
■ GeNii[ジーニイ]学術コンテンツ・ポータル
国立情報学研究所(NII)作成の学術コンテンツの総合検索システムです。 CiNii(サイニイ): 論文情報ナビゲータ【一部有料】、 Webcat Plus(ウェブキャット プラス)【無料】、KAKEN: 科学研究費成果公開サービス【無料】、 NII-DBR:学術研究データベース・リポジトリ【無料】が 検索できます。
http://ge.nii.ac.jp/genii/jsp/index.jsp
■ 日化辞データベース
(独)科学技術振興機構が無料で公開している日本化学物質辞書Webです。現在有料で提供 されているJCHEMデータベースとの違い等について議論がありました。
http://nikkajiweb.jst.go.jp/nikkaji_web/pages/top.html
■ 学会予稿集データベース
IyakuSearch(JAPIC)
http://database.japic.or.jp/
医学薬学予稿集全文DB(JST)【有料】
http://service.jst.go.jp/med-proc/cgi-bin/index.cgi
■ INN調査【登録制】
http://mednet.who.int/
第229回 ライフサイエンス分科会
記入者: (株)サンメディア 堀 恭子
開催日時: 2005年9月15日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 参加者各位の作成資料
参加人数: 12名
内 容: サーチエンジンの効率的な利用方法
1.検索エンジンの比較
「尿路感染症×ガイドライン」というテーマで文献検索をした場合、文献データベー スでは、 該当がたくさんヒットしますが、依頼者が求めているであろう「学会等が作成したEBMに基づく ガイドライン」を特定することが困難な時があります。学会等が作成した診療ガイドラインに ピンポイントでたどり着くには、Webでの調査が早道の場合があります。(最近は、医中誌が 「診療ガイドライン」のリストをWebに掲載し、また研究デザインのタグのひとつとして取り入れ られたようですので、 こちらも活用したいと思います)
そこで、それぞれ独自の検索エンジンを使っているGoogle、Yahoo、Altavistaで、「尿路感染症 ×ガイドライン」を検索して比較してみました。
YahooとAltavistaは、表示順位が異なってはいますが、上位20位にランクされたWebページは 似通っている部分がありました。
それに対して、Googleは前二者と異なる結果が返ってきました。筆頭にランキングさ れたのは、東邦大学による診療ガイドラインのページでした。診療ガイドラインのデー タベースとして定評のあるページですので、今回、得られた結果の中では、Googleが 一番満足の行くものでした。ちなみに、Googleの検索エンジンを使っているGooは、Googleと 同じ結果が返って来ました。
2.検索エンジンを活用する上で必要な知識
1. 各検索エンジン特有のランキング方式を理解する
→Googleは、PageRankにより、より多く引用されている文献が上位に表示されるしくみに なっている(引用度スコアによるランキング)
2. クローラーがWebを回る頻度を理解する
→一般のクローラーは、Webページの更新頻度に基づいて収集頻度を自動調整する。
さらにGoogleは、ニュースやブログのような頻繁に更新されるページは一日に何度も同じ ページを収集している(「情報の科学と技術」vol.52 no.2 p.86)。
3. アドバンスな検索方法を理解する
→検索エンジンがWeb上で提供しているので、それを理解して活用する
最後に、検索結果を活用する上で大事なポイントは、Webから得られた情報が信頼できるものか どうかを評価することだと考えています。そのためには、作成元をきちんと確認する必要があります。 公的な機関かどうかということもひとつの目安ですが、個人のサイトでも、アクセスが多く、 複数の人やサイトからリンク・引用され、ある一定の評価が得られていると推測される場合は、 信頼性の高い情報源と判断できるかと思います。
3.その他の紹介
時実象一先生が書かれた「理系のためのインターネット検索術」(講談社ブルーバックス、 2005年)からポイントの紹介がありました。GoogleとYahoo!では日本語の分割処理が違うので 結果が違ってきます。抽象的な用語での検索よりは資料に使用されそうな具体的な用語での 検索が重要になります。
Google Scholarも紹介されました。カバーしている論文数が少ないことや参考文献とてして 引用されている文献が最初に表示されることがあるなど、まだ問題が多いようです。
ある論文の「表」の出典と所在を依頼されて、サーチエンジンで探した例の紹介もありました。
Amazonが運営しているA9.comも紹介されました。
第228回 ライフサイエンス分科会
記入者: 固武 龍雄
開催日時: 2005年7月21日(木) 14:00~16:30
開催場所: ファイザー(株) 会議室
配布資料: 固武氏作成資料
参加人数: 9名
内 容: 情報検索手法の発展の跡をたどって
固武 龍雄
まず大妻女子大学木本先生ら作成の「情報検索の歴史 part-1」というビデオを上映した。 このビデオは昨年の情報プロフェッショナル・シンポジウでその一部分が上映されたが、 今回は木本先生のご厚意でその全部を見ることができた。
ついで固武より「情報検索手法の発展の跡をたどって」という内容の話があった。抄録誌、 索引誌の索引からはじまり、ハンドソート・パンチカード、マシンソート・パンチカード、 ピーカブー・カード等の過去においてよく使われた検索ツールの話があった。
また異なった観点から、マイクロフィルムによる蓄積と検索や化学構造式の蓄積・検索に 用いられていたWiswesser Line-Formula Chemical Notation(WLN)の話などがあった。 それからコンピュータによるバッチ検索からオンライン検索、CD-ROM等、現在までの話に及んだ。
木本先生からビデオを見た感想を報せて欲しいとのことだったので、アンケートを配り、 各人に記入してもらった。参考になった、非常に参考になったとの感想が寄せられた。 これをお返しするビデオとともに木本先生に送ったところ、後日お礼のメールをいただいた。
第227回 ライフサイエンス分科会
記入者: 宮崎 佐智子
開催日時: 2005年6月16日(木) 14:00~16:30
開催場所: (社)化学情報協会 6階講習会室
配布資料: 「STN ライフサイエンス系DBの変更点」
参加人数: 15名
内 容:勉強会「STNのライフサイエンス系DBの変更点」
(社)化学情報協会 宮崎 佐智子
2004 年 2 月以降の STN のライフサイエンス系DBの変更点や強化点をデモを交えてご紹介しました. 概要は以下のとおりです.
■ ライフサイエンス分野の新規ファイル (2004 年 2 月~ 2005 年 6 月)
ファイル名 収録内容 収録期間 収録件数 更新頻度
ANTE Abstracts in New Technologies and Engineering
英国と米国の新規技術と工学分野に関する文献情報. 1981- 35.3万 毎月
AQUALINE 水資源,水循環に関する文献情報. 1960- 24.7万 毎月
BIOENG Biotechnology and Bioengineering Abstracts
生物工学に応用される生化学およびバイオテクノロジーに関する文献情報. 1982- 49.8万 毎月
ENVIROENG Environmental Engineering Abstracts
世界中の大気・水質,環境保全,エネルギー生産技術・工学に関する文献情報. 1990- 16.6万 毎月
PATDPASPC German Supplementary Protection Certificates for Drugs and Plant Protection Agents
医薬品および植物用薬剤に関するドイツ特許の SPC (追加保護証) 情報. 1992- 676 不定期
PROUSDDR PROUS Drug Data Report
医薬品開発に関連する生理活性物質の情報. 1980- 17.4万 毎月
PS Pharmaceutical Substances
上市された医薬品の活性成分の情報. 1957- 2,369 半年に一度
WATER Water Resources Abstracts
水資源の特性,保護,管理,汚染,処理,用途に関する文献情報. 1967- 40.6万 毎月
■ ライフサイエンス分野の既存ファイルの強化 (2004 年 2 月~ 2005 年 6 月)
ファイル名 強 化 点
BEILSTEIN ・ 表示フィールドを追加した.
– ALLREF (そのレコードに含まれている全ての引用文献)
– ALLP (そのレコードに含まれている全ての引用特許)
– BABSAN (そのレコードに含まれている全ての BABS ファイルのレコード番号)
・ 新しい SELECT オプションを追加した.
– PN (特許番号)
– BABSAN (BABSファイルのレコード番号)
・ データの追加 (2004 年 8 月,11 月,2005 年 3 月,4 月)
– 現在約 913 万件の物質レコードと約 792 万件の物質に対する反応レコードが収録されている.
BIOCOMMERCE ・ 収録範囲と更新内容が変更された.
– 東欧諸国の発展中の企業や新規参入企業の情報を充実させる.
– ニュース記事抄録の更新は9月2日以降中止.ただし,収録済みのレコードはそのまま利用可能 (ニュース記事抄録を含む).
BIOTECHABS/BIOTECHDS ・ INPADOC の法的状況データが表示できるようになった.
– LS (法的状況の表示)
– LS2 (法的状況コードごとの詳細表示)
CAS FILES 全般 ・ 2005 年 4 月,CAS 提供データの利用制限が変更された.
CAplus/CA ・ 日本語タイトルが表示可能になった.
– STN CA Volume 141 以降
– STN on the Web (日本語を利用するオプションを選択した場合)
STN Express V7.0 以降 (SJIS モードで接続) で利用可能に.
– 原文献が日本特許 : 原文献の標題をそのまま収録
原文献が日本特許以外: TI フィールドの和訳 (機械翻訳)
・ 表示フィールドを追加した.TIJP (日本語標題).
・ CA Lexicon 日本語ターム追加.
– 約 31,000 語以上が追加された.
・ 1900年代初頭の文献情報を追加 (2004 年 10 月).
– 約 31,000 語以上が追加された.
・ 索引情報の強化(随時追加).
CASREACT ・ 酵素触媒反応情報の追加した.2004. 6
– 1971年~1998年に発行された特許・論文から約 4000 件
CERAB ・ 更新再開 (更新は毎月)
CHEMLIST ・ 既存化学物質リスト関連情報を更新した.
– TSCA台帳 (2005.1版)
– ECL (韓国化学品・2004 年 6 月分まで)
– ENCS (日本・化審法台帳) (2004.1)
– ELINCS (EC・化学物質台帳) (2003.10 第 6 版)
DDFU/DRUGU/DDFB/DRUGB ・ キーワードの改定
– 精神病に関するキーワードを DSM-IV (Diagnostic and Statistical Manual of Mental Disorders – Fourth Edition) で使用されている標準的な用語に対応させた.
– この改定により,データベース間のクロスオーバー検索が便利になった.
DGENE ・ INPADOC の法的状況データが表示できるようになった.
– LS (法的状況の表示)
– LS2 (法的状況コードごとの詳細表示)
EMBASE ・ /AB フィールドで (S) 演算子が利用可能になった.
・ /AB, /TI フィールドで SLART が利用可能になった.
・ 表示内容を追加した.
– ED (UP) フィールドが BIB, IBIB, ALL, DALL, IALL 表示形式に追加
・ 検索・表示フィールドを追加した.
– URL (/URL)
・ 基本索引でストップワードが無くなった.
MEDLINE ・ 1951 年までのデータを追加した (TOXCENTER のMEDLINE セグメントも同時に追加).
・ リロード (TOXCENTER のMEDLINE セグメントも同時にリロード)
MSDS-CCOHS ・ 表示内容を追加した.
– CO (Company Name;会社名) フィールドに(存在すれば)製造者および供給業者双方の メールアドレスと URL が表示される.
・ 表示内容を変更した.
– CO (Company Name;会社名)
PHAR ・ 物性などのデータを追加した.
・ 検索・表示フィールドを追加した.
– 回転可能な結合 (/FRB)
– 水素受容基数 (/HAC)
– 水素供与基数 (/HD)
– オクタノール
– 水 分配係数の対数値 (/LOGP)
– 分子量 (/MW)
– 分子量 (遺伝子名称 (/GEN))
・ – LIPINSKI/CALC が利用可能になった.
REGISTRY ・ CA 由来の実測物性データを追加した.
・ 実測物性値に関する参照文献タグを追加した.
・ 核酸配列情報の注記コードを追加した.
– 2005 年 1 月中旬以降に登録されたレコードで使用可
SciSearch ・ 研究フロントに関するフィールドが削除された.
– Research Front (RF) - 検索・表示フィールド
– Research Front Word (/RFW) – 検索フィールド
– Research Front Weight (/RFWT) - 検索フィールド
TOXCENTER ・ MEDLINEセグメントの収録年を拡大した.
– MEDLINEセグメントに 1950 年までのデータが追加された.
・ MEDLINE セグメントをリロードした.
第226回 ライフサイエンス分科会
記入者: 固武龍雄、戸上康弘、堀恭子、齊藤真紀子
開催日時: 2005年5月19日(木) 14:00~17:00
開催場所: ファイザー(株) 会議室
配布資料: 参加各位の検索結果
参加人数: 9名
内 容:検索演習
問1. アルツハイマー病をワクチンで治療している症例報告
レビューのような、ワクチン治療について紹介しているものではなく、 実際に治療 (予防でなく)を実施した症例報告。日本の文献は殆どないので、 外国文献のデータベースを使用すること。
MEDLINEのサブヘディングやEMBASEのリンク語において、医薬品を用いて治療している場合に、 疾病名と組み合わせるものは drug therapy(DT)であるが、ワクチンなどで治療している場合は DTではなくて、therapy(TH)を用いることになっている。このことが本当にそのように索引者に よって行われているかが出題者の前からの関心事であった。
皆さんの検索例ではDTを用いている人はなかったが、それはワクチンではDTではなくTHである ことを知っていた人もいるが、DTがあることを考えずにTHを使った人もいるように感じた。 また中にはサブヘディングを用いないで検索した人もいた。
ところで、THでなくDTを用いて検索してみると、この場合でも得られる適合文献があった。 特にEMBASEでは多かった。何事もあまり鵜呑みにしてはいけないと感じた。
症例報告に絞るについてはMEDLINEではPublication typeのcase reportsの他に、 clinical trial やcontrolled clinical trialをも用いた方がよい。 これらをいちいち用いずにNOT reviewとした人もいる。
問2. 小児糖尿病の疫学に関する文献
患者数を文献データベースから探すのには限界があり、公的な患者調査、研究 報告書、学会の統計など様々な情報源を探していくことも必要となる。
JMEDplus、医中誌Web医学文献データベース。総説の引用文献をたどっていく事も有効。
「厚生労働科学研究成果データベース」と「科学研究費補助金成果公開データベース」 (インターネットで公開)。「政府資料プラットホーム 政府資料データベース」(会員専用)。
厚生労働省の「患者調査」などの統計データ。
インターネット検索。
問3. LDL高値(160)の透析患者の透析回路内で血液が乳び(白く濁った)した 症例報告等(日・英)
検索方法:「透析」*「LDL、高リポ蛋白血症」*「乳び・白濁」で該当が見つからなかったため、 「LDL、高リポ蛋白血症」→「コレステロール、リポ蛋白」、「乳び、白濁」→「排液、混濁」、 それぞれキーワードを広げて検索。
検索結果:「CAPD患者で乳び排液あるいは排液白濁を呈した」でヒット。
結果の評価:「透析」と「CAPD」は異なるものなので、「CAPD」だと該当文献ではないので はないか。
入力注意:医中誌Webは表記検索なので、「乳糜」「乳び」の両方を入力する。
#1 (乳び/TH or 乳び/AL) 2,084件
#2 (乳び/TH or 乳糜/AL) 1,165件
#3 #1 or #2 2,342件
入力注意:JMEDplus(JOIS)で、「乳び」「白濁」がきちんと切り出されているか。
JOIS: 乳び 1,517件、白濁 515件
JDream:乳び 1,746件、白濁 541件
問4. 海馬補腎丸(漢方薬)に関する英語文献
海馬補腎丸を英語で何というかの調べ方
JMEDPLUS、JSTPLUSで「TIEN」の項を確認
CALexicon
STNのINDEX
DialogのDIALINDEX
Google
製造業者のウェブページ、パッケージ写真
中国語の辞書で漢字の読みを一語ずつ調べる
DB検索の際の注意
読みの切り方は考えられるもの全てのパターンで行う
海 馬 補 腎 丸 HAI MA BU SHEN WANの場合:
HAIMABUSHEN?、HAIMA()BUSHEN?、HAI()MA()BUSHEN?、HAI()MA()BU()SHEN?、etc.
第225回 ライフサイエンス分科会
記入者: 石井 恵子
開催日時: 2005年4月21日(木) 14:00~16:30
開催場所: 政府資料等普及調査会
配布資料: 政府資料等普及調査会利用案内、政府資料アブストラクト
参加人数: 11名
内 容:
1.政府資料等普及調査会の概要
府省庁で作成される資料(以下、資料)は、販売を目的とする資料については 「政府刊行物サービスセンター」が販売しているが、販売を目的としない資料については 入手が困難であった。このような政府資料について、収集・整理を行ない普及することを 目的に政府資料等普及調査会が設立された。政府資料等普及調査会は、会員(企業・大学・ 自治体等)からの会費により運営され、政府からの補助金は無い。
2.資料の収集、整理について
収集については、可能な限り収集するようにしているが、全て収集することはできないので 研究費の大きなものや要望のある資料を中心に収集している。また、年報など、定期的に発行 される資料はほぼ入手している。収集方法は、基本的に省庁に出向き、担当官から入手している。 一部インターネット上に置かれている資料も収集しているが、ほとんどの資料は担当官と面談して 入手している。
整理方法は、基本的に時系列で配架し、閲覧室に置けなくなったものは事務所内の閉架書庫や 一般の倉庫に保存している。
3.情報サービスについて
政府資料等普及調査会では、会員向に下記の情報サービスを提供している。
「政策情報プラットホーム」:政府資料データベース(Web版)
「デジタル・バード・インデックス」:新しく作成される資料に関するE-mailサービス
「レファレンス・サービス」:必要な資料・情報の問合せ(電話、Fax、E-mail)
「政府資料アブストラクト」:政府資料の書誌データ、抄録を収録した月刊誌
「資料の閲覧・貸出」:閲覧室の利用サービス
「資料の複写・送付サービス」:所蔵している資料の複写、送信サービス
その他:月例研究会の開催、受託調査など
4.その他
「特集:科学技術情報流通を俯瞰する 政府補助均等による研究開発情報の収集とサービス -政府資料等普及調査会の経験から-」(情報の科学と技術:Vol.54 No.6, 303-309, 2004)の 紹介