[-> Archives of Dr. mn's Research Works]
Laboratory and Clinical Practice 15(1) : 22-26、1997

New Technology

インターネットを用いた形態検査の精度管理

西堀眞弘
東京医科歯科大学医学部附属病院検査部

The Quality Control of Morphological Laboratory Tests Using the Internet

Masahiro NISHIBORI
Clinical Laboratory, Tokyo Medical and Dental University Medical Hospital, Tokyo

[published edition]
 2年程前はまだ一部で騒がれているだけだったインターネットも、今や急速な勢いで社会に浸透し、文字だけでなく静止画像、音声、ビデオなどのマルチメディア情報を満載したホームページが、日常の仕事や生活の隅々にまで入り込んでくる日もそう遠くない。臨床検査の分野も例外ではなく、その中で最近注目されているのが形態検査の精度管理への応用である。
 これまでは標本を撮影したスライド写真を配布し、各施設で判定した結果を返送するという方法が一般的であったが、費用と手間、写真の均一性の確保などの制約から、出題症例数が限られるうえ、個人単位または小規模施設の参加が困難であった。そこで最近、インターネットを使ってスライド写真をホームページに掲載し、参加者が直接アクセスして回答もインターネットで返送するというサーベイが実用化されつつある。この方法は、参加者の数や所在地にかかわらず、全く同一の画像を何枚でも簡単に配布できるうえ、コストも著しく軽減されるので、うまく運用すれば誰でも気軽に参加できるサーベイの実施が可能になる。

インターネットのしくみ

 誰でもインターネットに接続すれば、一定の費用負担で世界中のホームページが閲覧でき、また世界中のインターネット利用者と電子メールが交換できる。このことがインターネットの爆発的な普及の原動力となっているが、一体どのようなしくみでこのようなことができるのだろうか。

1)データ転送のしくみ(図1)
 インターネットで基本となるデータの通信方式をInternet Protocol(IP)と呼ぶ。インターネットに接続する全てコンピュータにはそれぞれ世界にひとつしかない番号が割り振られる。これをIPアドレスと呼び、情報の送り手と受け手を間違いなく特定する拠り所となる。IPアドレスは現在32桁の2進数と定められ、見易いように8桁ごとに区切り、0〜255の10進数に変換してピリオドでつなげた形で表す。例えば11000000100000001111111100000000は192.128.255.0となる。


図1 インターネットのデータ転送のしくみ



 インターネットの中では通信回線が網の目のようにつながっており、網の結び目に当たる部分にはルータと呼ばれる通信振り分け装置が置かれている。あらゆるデータはまずパケットと呼ばれる小さな単位に小分けされ、送信元と宛先のIPアドレスや各種制御情報が付けられたうえ、送信元のコンピュータに最初につながっているルータに送られる。ルータは受け取ったパケットを、次につながっているルータのうち、最も目的地に近いと考えられるルータに送る。これを繰り返して次々とルータを経由したパケットは、最終的に宛先のコンピュータに到達する。
 各ルータはIPアドレスとルータを対応させたルーティングテーブルという一覧表を記憶しており、受け取ったパケットを渡す次のルータはこの表に従って決められる。新しいルータが接続されたり、あるいは経路途中の回線が障害されると、ルータ同士が互いに連絡をとって、それぞれのルーティングテーブルをリアルタイムに更新し、障害された経路を迂回しつつ、できるだけ短い経路および時間で宛先に到達できるような組み合わせを常時維持するようになっている。
 ルーティングテーブルがダイナミックに更新されるため、同じIPアドレスに送られるパケットでも異なる経路をたどり、到着する順序が変わる可能性がある。またルーティングテーブルに誤りが生じたり、宛先に至る通信回線あるいはルータがすべて障害され、パケットが迷子になることもある。このような事態に対処するため、到着しなかったパケットを再送したり、乱れた順序を正しく並べ替えるための手順が定められており、この他にもさまざまな障害への対策が図られている。この手順はTransfer Control Protocol(TCP)と呼ばれ、Internet Protocolとひとまとめにして「TCP/IP」と呼ばれる。
 TCP/IPには、一台のコンピュータで2つ以上の異なる相手と同時にデータ交換できる機能があり、相手はポート番号と呼ばれる数字で区別できるようになっている。「192.128.255.0」というIPアドレスにあるコンピュータのAというプログラムがポート番号1を使い、Bというプログラムがポート番号2を使っていた場合、相手のコンピュータは宛先を「192.128.255.0:1」とすることで間違いなくプログラムAにデータを送ることができる。1台のコンピュータで異なるアドレスのホームページを同時に表示できるのは、この機能のお陰である。

2)ドメインネーム
 数字の羅列であるIPアドレスの代わりに、より親しみやすいアドレスの表現方法も提供されている。これをドメインネームと呼び、いくつかの英数文字列をピリオドでつなげた形で表す。例えば、東京医科歯科大学のホームページを配信しているコンピュータには「www.tmd.ac.jp」というドメインネームが与えられており、「jp」から日本国内にあること、「ac」から管理者が教育機関(academic)であること、「tmd」は管理者である大学名の略称、「www」からホームページを配信していることが推測できる。
 それぞれのドメインネームは世界にひとつしか存在せず、ただひとつのIPアドレスに対応する。この対応表は、ドメインネームサーバと呼ばれる多数のコンピュータに、それぞれ決められたドメインネームのグループごとに分けて登録されている(図2)。


図2 ドメインネームサーバへの問い合わせ



 ルータはドメインネームを理解できないので、データの宛先にドメインネームが指定されると、送信元のコンピュータはまず、自分に割り当てられたドメインネームサーバに、指定されたドメインネームに対応するIPアドレスを問い合わせる。ドメインネームサーバは、登録があれば直ちに回答し、登録外であれば、登録されていそうな他のドメインネームサーバを紹介する。送信元のコンピュータは紹介されたドメインネームサーバに同じ問い合わせをし、これを繰り返してIPアドレスを教えてもらう。なお、全てのIPアドレスに対応するドメインネームが存在するとは限らず、またドメインネームサーバへの問い合わせがうまくいかないこともあるので、そのような場合はIPアドレスを直接指定する必要がある。

3)電子メールのしくみ
 電子メールの配送は、施設や利用者グループごとに設置されたメールサーバと呼ばれるコンピュータが担当する。メールサーバは、自分の登録利用者の電子メールを宛先に向けて発送したり、送られてきた電子メールを登録利用者に届けたりするだけでなく、他のメールサーバから別の宛先に送られる電子メールの中継も行う。
 電子メールの住所は、利用者ひとりひとりに与えられるアカウントと呼ばれる英数文字列と、利用者に割り当てられたメールサーバのドメインネームを「@」でつなげて表す。アカウントは覚えやすい別のユーザネームに置き換えることもできる。例えば、著者のユーザネームは「mn.mlab」、メールサーバのドメインネームは「med.tmd.ac.jp」なので、メールアドレスは「mn.mlab@med.tmd.ac.jp」となる。
 あるメールサーバに向けて発送された電子メールを受け取ったり、あるいは中継できるメールサーバのドメインネームのリストは、多数のドメインネームサーバに、それぞれ決められたドメインネームのグループごとに分けて登録されている。
 利用者が発送した電子メールは、まずその利用者に割り当てられたメールサーバに送られる。メールサーバは宛先のドメインネームを見て、そのメールを受け取ってくれるか、あるいは中継してくれるメールサーバのドメインネームを、自分に割り当てられたドメインネームサーバに問い合わせる。回答はIPアドレスの問い合わせと同じ手順で行われる。回答として複数のドメインネームが得られた場合は、一定の規則に従って順序をつけ、まず最初のメールサーバに送ってみて、うまくいかなければ次のメールサーバに送るという手順を繰り返す。何らかの原因で全てうまく送れなかった場合は、一定時間後改めて最初からやり直し、通信回線やメールサーバの障害が起こっても、可能な限り宛先に届けるよう最善を尽くす。

4)ホームページのしくみ
 ホームページの本体は、HTML(Hyper Text Markup Language)と呼ばれるフォーマットで書かれた文書ファイルである。HTMLを使うと、文字・静止画像・動画像・音声を含む書式の整った文書を、コンピュータの機種に関係なく同じように扱うことができる。通信回線を介してHTML文書を配信するためにHTTP(Hyper Text Transfer Protocol)という通信方式が定められており、この通信方式でホームページを配信するコンピュータをHTTPサーバと呼ぶ。配信されたHTML文書を表示するためのソフトを「ブラウザ」と呼び、現在では殆どの機種について入手可能である。
 HTMLでは、文字のフォントの大きさ・種類、飾り文字などの属性情報、静止画像・動画像・音声の挿入位置、レイアウト情報などを、あらかじめ定義されたコマンドとしてテキストの中に混在させて記述する。コマンドは「タグ」と呼ばれ、必ず「<」と「>」の間に挟むことになっている。
 図3(a)にホームページの画面表示例、図3(b)に同じホームページをHTML形式で表示させたものを示す。両者を比べると、HTMLには画面に表示される文字列以外に、たくさんのタグが埋め込まれていることが分かる。


図3 設問ページの例

(a)画面表示



(b)HTML

<HTML> <Head> <Title>The Survey Web-1996A</Title> </Head> <BODY BACKGROUND="pictures/lightyellow_stucco.jpg" BGCOLOR="#E0D8A8" TEXT="#202020"> <A NAME="TOP"></A> <IMG SRC="pictures/R_hand.gif" ALIGN=LEFT> <A HREF="survey.html">臨床検査公開サーベイのホームページへ / The Survey Web Home Page</A> <H2>形態検査インターネットサーベイ-1996A<BR>The Internet Survey of Morphological Laboratory Tests-1996A</H2> [Every important document here is written in both Japanese and English, so please neglect queer characters other than English if you do not understand Japanese] <UL> <LI>このページは平成8年度文部省科学研究費補助金(奨励研究(A)課題番号08772180)の配分を 受け、<A HREF="#Supervisors">監修</A>および<A HREF="#Cooperators">画面編集</A>に多くの方々 のご協力を得て作成されました。 </UL> <A NAME="Questions"><BR></A> <H3>設問 / Questions (-><A HREF="#Answer">回答方法 / How to Answer</A>)</H3> <DL> <DT><B>設問番号:1996a-u11 / Question Number: 1996a-u11</B> <DD>これは尿沈渣のSternheimer染色像です。たくさん見える細胞は何ですか。 <DD>This urinary sediment is Sternheimer-stained. Identify cells mainly seen here. <BR> <IMG SRC="pictures/surveyweb1996a-u1.jpg"> <P> <BR>  …

 「形態検査インターネットサーベイ-1996A」というタイトルとその下の英語表記は、ヘッダ(見出し)を意味する<H2>タグと</H2>タグで挟まれているため、大きめの太字フォントで表示され、上下に間隔が取られる。日本語と英語の境目の<BR>タグは、ラインブレイク、即ち「ここで改行せよ」という意味である。またスライド写真が表示されているところを見ると、下から3行目に

 <IMG SRC="pictures/surveyweb1996a-u1.jpg">

というタグがある。これはイメージタグと呼ばれ、「このHTMLファイルと同じディレクトリにある『pictures』というサブディレクトリから『surveyweb1996a-u1.jpg』という画像ファイルを読み込んで、この位置に表示せよ」という意味である。動画像・音声についても、それぞれに決められたタグを配置すれば、簡単に表示・再生ができる。
 これらに加え、ホームページには「ハイパーリンク」と呼ばれる画期的な機能が組み込まれている。図4(b)の上から9行目を見ると

 <A HREF="survey.html">臨床検査公開サーベイのホームページへ / The Survey Web Home Page</A>

というタグがある。これはアンカータグと呼ばれ、タグとタグに挟まれている色付き文字の部分をクリックすると、「HREF=」の次の引用符で挟まれた名前のファイルを読み込むという機能を持つ。この例では「同じディレクトリにある『survey.html』というHTMLファイルを読み込み、ホームページとして表示せよ」という意味になる。
 このファイル名の部分にUniform Resource Locator(URL)と呼ばれる書式を使うと、インターネットに接続された全てのコンピュータが配信するファイルの取得方法・所在・名前を記述できる。URLとHTMLと組み合わせた文書記述体系をWorld Wide Web(WWW)と呼び、これを使うとクリックひとつで世界中のホームページを読み込んで表示できるようになる。
 URLの例を示すと、東京医科歯科大学医学部附属病院のホームページは、

 http://www.tmd.ac.jp/medhospital/index.html

となる。これは「www.tmd.ac.jp」というドメインネームをもつコンピュータを探し、その「medhospital」というディレクトリからHTTPという通信方式で「index.html」というHTMLファイルを読み込むという意味になる。もしFile Transfer Protocol(FTP)という通信方式でファイルを配信しているコンピュータからファイルを読み込む場合は、「http」の部分が「ftp」となる。またサーバのアドレスをIPアドレスで表示することもできる。
 この他にURLは、利用者がブラウザに見たいホームページを直接指定するときや、イメージタグで画像ファイルの場所を指定するときなどにも使うことができる。そのため、URLが「インターネットのアドレス」と慣用的に呼ばれることも多い。

5)インターネットの特徴
 インターネットでは、以上に説明したような形式でデータ転送が行われるため、IPアドレスやドメインネームの一意性を保つこと以外に全体的な管理は不要で、ルータのどれかに新しいルータを接続するだけで無限に拡張でき、新たなコンピュータの追加接続は、IPアドレス、ルータおよびドメインネームサーバを設定すればいつでも可能である。物理的な通信回線の種類に制約はなく、光ファイバーから電話線まで何でも使える。このような特徴が、著しく低コストの世界的ネットワークをいとも簡単に実現してしまう基本的要因となった。さらにWWWの導入により、従来の手紙、電話、テレビ、ラジオ、パソコン通信など別々に行っていたあらゆる情報伝達・情報交換を、すべて代替してしまう画期的機能を備えるまでになった。
 一方、ルータや通信回線がばらばらに管理され、管理責任もあいまいなため、通信の信頼性やセキュリティーが完全には保証されていない。通信速度も、通信経路中最も遅い回線がボトルネックになるので、利用が急拡大すれば渋滞の発生は避けられない。電子メールなどは、別々に管理されたいくつものメールサーバを経由するため、技術的には情報の漏洩や改竄が容易に起こりうる。そこで、現在得られる限りの最先端の暗号技術や通信技術が次々と投入され、これらの問題点の解消に向けた作業が急ピッチで進められている。

デジタル画像のしくみ

 インターネットが形態検査のサーベイに使えるようになった背景には、インターネットそのものの普及に加え、画像処理技術の飛躍的な進歩がある。画像はコンピュータの中でどのように扱われ、遠く離れた場所に送られ、忠実に再現されているのであろうか。

1)画像表示のしくみ(図4)
 CRTや液晶ディスプレイなどの表示装置は、碁盤の目のように規則正しく縦横に並んだ小さな画素のひとつひとつを、さまざまな色や明るさで光らせ、あらゆる画像を再現する。表示の最小単位となる画素を表示装置のピクセルと呼ぶ。ピクセルの密度を解像度といい、1インチ当たりの数をdpi(dot per inch)という単位で表す。一方人間の眼は、網膜上にびっしりと敷き詰められた錐状体が光センサーの最小単位となり、視覚情報を脳に送っている。錐状体の直径4μmは視角の約1′に相当し、眼から20cm離れた位置ではおよそ400dpiの解像度に相当する。現在普及している表示装置は72〜100dpiなので、この段階で実像に比べ4分の3以上の情報が失われることになる。眼と画面の距離を増せば網膜に映る映像の解像度は上がるが、錐状体の密度に匹敵させるには1m以上離すことが必要となる。



図4 デジタル画像の表示



 人間の眼は、赤・緑・青の三原色それぞれに反応する細胞が分担して色情報を検知しているため、単波長の光の色と、三原色を混ぜ合わせて作った色を区別できない。この錯覚を利用し、カラー表示装置は三原色の3つの発光点をワンセットにしてひとつのピクセルを構成し、各発光点の明るさを独立に変えることでピクセルの色を表現している。全て同じ明るさにするとグレースケール表示となる。カラー表示装置で白く表示されている部分を拡大すれば、規則正しく並んでいる三原色各々の発光点を確認することができる。三原色各々の明るさを256段階の階調で変化させれば、256の3乗即ち1680万色を表現できることになるが、人間の眼はこれ程細かく色を識別できないので、実際には32の3乗即ち32000色で十分であることが多い。
 同じ色情報を持った画像を表示させても、入力と得られる輝度の関係を表す特性曲線は表示装置によって異なり、ガンマ補正という方法である程度ばらつきを吸収しているが、完全に同じ色にはならない。特にCRTと液晶ディスプレイでは発色の原理が全く異なるので、一致させるのは容易ではない。このような不都合の解消を目指し、ディスプレイやプリンタなどに出力される色を統一するため、現在ColorSync(TM)という規格の普及が進められている。

2)デジタル画像のデータ形式
 画像をコンピュータで扱う場合は、画像全体を碁盤の目のような区画に分割し、そのひとつの区画ごとにひとつの色情報を割り当てる。この区画を画像データのピクセルと呼び、その密度をdpiで表す。表示装置の1ピクセルに画像データの1ピクセルを表示した場合、画像データの密度より高い解像度を持つ表示装置では、画像全体の大きさが元より小さく表示され、解像度が低いと元より大きく表示される。色情報の記録には、赤(R)・緑(G)・青(B)の三原色それぞれの明るさを数値化する方法がよく用いられ、これをRGBコードという。例えば明るさの階調数を256とする「RGBフルカラー」と呼ばれる形式では、1ピクセル当たりに必要な情報量は、各色8ビットで計24ビット(3バイト)となる。解像度72dpiの表示装置で10cm×7.5cm程度の領域を占める画像を例にとると、280ピクセル×210ピクセル×3バイト=約180キロバイトのデータ量となる。同じ面積を文字で埋めてもせいぜい1キロバイトに満たないので、画像の情報量がいかに多いかが分かる。
 アニメ映像のように色の種類が限られている画像は、各々のRGBコードにインデックス番号を割り当て、各ピクセルの色情報をその番号で表す方法が用いられ、この方法を「インデックスカラー」と呼ぶ。インデックス番号として0〜255を使う場合、必要な情報量はRGBフルカラー3分の1で済むが、表示には「カラーパレット」と呼ばれる、インデックス番号とRGBコードを対応付ける表が画像ごとに必要となる。
 デジタル画像は、同じRGBコードが多数反復しているなど、数値情報として見ると著しく冗長であることが多い。また人間の目は画像のデータをかなり間引いても誤魔化せることが分かっている。これらの特徴を利用し、できるだけ少ない情報量で同じ画像を再現できるようにする技術を画像圧縮という。ホームページに掲載されるデジタル画像では、JPEG(Joint Photographic Experts Group)とGIF(Graphics Interchange Format)という2つの圧縮形式が標準となっている。JPEGはRGBフルカラー形式の画像を5〜15分の1程度に圧縮でき、カラー写真のような画像では元の画像と殆ど区別できないが、一部のデータが捨てられてしまうので復元はできない。GIF形式が使えるのはインデックスカラー形式の画像に限られ、圧縮率は画像に依存するが、概ね3分の2から半分程度にまで圧縮できる。
 以上のような形式で記録されたデジタル画像は、保存、転送あるいは複写によって画質が全く変化しないという、アナログ画像にはない優れた特長を有している。

3)デジタイズのしくみ
 ビデオ画像や写真などのアナログ画像をデジタル画像に変換する操作をデジタイズという。静止画像のデジタイズにはスキャナー、フィルムレコーダ、デジタルカメラなどが用いられるが、いずれも原理は同じである。まずアナログ画像を細かな碁盤の目のような区画に分け、それぞれの区画ごとに色を平均化して1つのRGBコードに変換する。したがって元画像の情報の一部は必ず失われることになる。区画の密度をデジタイズの解像度といい、dpiで表す。解像度が高い程元画像に忠実なデータが得られるが、データ量は密度の2乗に比例して増加する。例えば、およそ600万の銀粒子で画像を記録している35mmフィルムのスライド写真の場合、Kodak PhotoCD(TM)という方式では、約2200dpi、RGBフルカラーで2048×3072ピクセルのデジタル画像に変換するため、1枚当り約24メガバイトのデータ量となる。

4)視覚認知のしくみ
 これまでの説明で分かるように、ホームページに掲載されるデジタル画像は、デジタイズ、画像圧縮、表示の過程で、元の画像の持っている情報量の大部分を失ってしまう。例えば図1(a)で示されているスライド写真は、約40キロバイトのデジタル画像に加工されたもので、デジタイズされた元画像のおよそ600分の1の情報しか持ってない。しかし実際に表示された画像を見ると、かなり忠実に再現されていることに驚く。
 これは人間の脳が網膜に映った像をかなり抽象化して捉えていることによる。即ち視覚情報の中から特徴的な部分だけを抽出し、形の類似性を瞬時に判断するという、高度な視覚認知機能が備わっているためである。具体的にどのような特徴を捉えているかについては、白血球の分類等についてはある程度解明されているが、その他については殆ど明らかにされていない。したがって現時点においては、さまざまな画像についていろいろな条件で処理し、実際に表示させて評価するという試行錯誤を積み重ねる以外に、最良の結果を得る方法はない。

インターネットを用いた形態検査のコントロールサーベイ

 日本臨床検査医会の有志が中心になって実施しているサーベイについて、ホームページの表示例を図3(a)および図5に、実施手順の概要を図6に示す。対象分野はまず尿検査、血液検査および細菌検査でスタートし、その後免疫学的検査、生理検査、細胞診にも拡大され、出題および技術的監査をそれぞれの分野の専門家が担当している。出題されたスライド写真はKodak Photo CD(TM)システムでデジタイズし、画像編集ソフトのAdobe Photoshop(TM)を用いて加工する。それぞれのデジタル画像は72dpiで372 x 254ピクセルの大きさに統一し、ネットワークの負荷を軽減するため、所見を読み取るのに支障を来さない範囲で、ファイルサイズができるだけ小さくなるようにJPEG形式で圧縮する。全ての画像は代表的ブラウザソフトであるNetscape Navigator(TM)とInternet Explorer(TM)を用い、数種類のCRTおよび液晶ディスプレイ上で、表示に問題がないことを確認する。これらの判定用画像をインターネットのホームページ(URL http://202.242.169.152/clap/survey.html)に設問および回答方法と共に掲載し、最終チェックの後実施をアナウンスする。



図5 設問ページの例(血液検査)




図6 実施手順の概要



 海外からのアクセスの可能性も考え、ホームページ上の文章は英語を並記している。参加には特に条件を設けず、個人の資格もしくは施設単位のどちらでも可能とし、定められた形式に沿って電子メールで回答が送られれば、直ちに正式な参加として受け付ける。回答の集計作業後、結果、模範回答および講評を当該ホームページで公開し、参加者は自己採点および自己評価を通じて各々の技術向上を図る。
 これまでこの方法によるサーベイを2回実施したが、スライド写真をホームページに掲載する過程での画質劣化が原因となって出題できなかった例はない。ただし十分な画質を確保するためには、色調の調整や圧縮率についての試行錯誤が欠かせず、最終的なファイルサイズは最小20キロバイトから最大144キロバイトまで大きな差が生じた。このことから、検査所見を読み取るために必要十分な画像の情報量は、検査項目や所見ごとに著しく変動することが示唆される。なおこれまで2年間で、国内外から3千件以上アクセスがあったが、画像1枚がうまく表示されなかった1例を除き、画像の転送および表示に関して大きな問題は生じていない。

おわりに

 形態検査のサーベイにインターネットを利用すれば、運営および参加に必要な事務作業を著しく軽減でき、これまで困難であった個人や零細施設の参加も極めて容易になるうえ、出題数や実施頻度の制約も無くなり、実地レベルにおける検査精度の向上に大きな効果が期待できる。インターネットの通信速度や機能の限界、あるいは回答に電子メールの操作が必要となる点などが改善されれば、形態検査に関する国内外の現行の精度管理事業が、すべてこの方法に置き変わる可能性もある。また、この方法には動画像を配布する機能を容易に組み込めるため、これまで困難であった超音波検査分野の精度管理も実施可能となる。このように、インターネットという革新的な道具を得て、形態検査の精度管理は今後あらゆる意味で飛躍的な発展を遂げることが予想される。

参考文献

[1]
西堀眞弘:インターネットを使って臨床検査医による診療支援活動をネットワーク化する研究、第16回医療情報学連合大会論文集、634-635、1996年
[2]
西堀眞弘、大場康寛、伊藤機一、渡辺清明、菅野治重:インターネットを使って形態学的検査のコントロールサーベイを実施する研究、臨床病理 第45巻補冊、178、1997年
[3]
西堀眞弘:形態検査の外部精度管理にWWWを利用する研究 第17回医療情報学連合大会論文集、798-799、1997年


[-> Archives of Dr. mn's Research Works]