ページの先頭です。

2012/01/26 09:09

連載

[週刊BCN 2012年01月23日付 Vol.1416 掲載]

もう「外字」で困ることはない
サイバー大学 IT総合学部教授 前川 徹

略歴

三重県出身、1978年 通商産業省入省、通産省機械情報産業局情報政策企画室長、JETRO NewYorkセンター産業用電子機器部長、IPAセキュリティセンター所長、早稲田大学客員教授などを経て、2007年4月から現職、コンピュータソフトウェア協会専務理事などを兼任。
 文字をコンピュータで扱うためには、それぞれの文字に異なるコード番号を割り当てると同時に、その文字を表示・印刷するためのフォントを必要とする。コンピュータ間でデータを交換することを考えると、この文字コードは標準化されていることが望ましい。このため日本工業規格(JIS)で漢字コードが決められている。このJIS漢字コードでは、常用漢字2136文字を含む約1万の漢字がコード化されている。「外字(がいじ)」とは、こうした標準文字セットに含まれていない漢字をいう。外字は姓名や地名に多い。例えば、「わたなべ」の「べ」は常用漢字では「辺」だが、JIS漢字コードでは「邉」と「邊」が登録されている。これ以外にも数多くの「べ」が存在する。「さいとう」の「さい」や「たかはし」の「たか」も外字が多い。

 人の姓名を扱う自治体の住民記録システムや法務省所管の戸籍では、無数にある外字をコード化せざるをえない。かつては、自治体ごとに、あるいはシステムごとに、必要となった外字に未使用の適当なコードを割り振っていた。当然のことながら、この方法では電子化に余計なコストがかかるし、システム間でデータを交換するとその外字が表示されなかったり、別の漢字になってしまったりする。これが「外字問題」である。

 最近、ようやくこの外字問題解消の道筋がみえてきた。10年ほど前、地方自治体の住民記録システムに接続する「住民基本台帳ネットワークシステム」構築のために、比較的よく使われる外字がコード化され、「住民基本台帳ネットワーク統一文字」(約2万1000字)に組み入れられた。さらに2004年には、法務省によって、戸籍のオンライン化のために「戸籍統一文字」(約5万6000字)が整備された。そして昨年、IPAの国際標準推進センターが、戸籍統一文字を含む5万8712文字について、国際標準に準拠したコードと文字フォントを公開したのである。

 この行政機関向けの文字情報基盤を利用すれば、国と地方自治体の行政機関はもちろん、民間企業も情報システムをシームレスに連携させることが可能となる。また、一度コード化すれば、書き間違いで生まれてしまった異体字(実際は誤字)を正字に修正することも容易になる。もちろん、既存システムにすぐに組み込まれることにはならないが、30年あまりIT業界を悩ませてきた問題が解決に向けて動き出すことは間違いない。実に朗報である。

■おすすめの記事





PR

週刊BCN購読のお申し込みはこちら

Bizline会員サービス(無料)のご案内 新規会員登録はこちら

PR










ITジュニアの広場

「ITセミナー・イベント」コーナーで注目商品・サービスなどのセミナーを一挙公開!

過去の掲載記事一覧

ITビジネス情報紙「週刊BCN」

ITビジネス情報誌「週刊BCN」
2017年04月10日付 vol.1673
Survive or Die !? AI時代のIT業界 2017 今、知っておくべきAIとのつき合い方

2017年04月10日付 vol.1673 Survive or Die !? AI時代のIT業界 2017 今、知っておくべきAIとのつき合い方

「週刊BCN」購読お申し込み
BCN Bizline ITを売るパートナービジネスの創造を

「BCN Bizline」は、株式会社BCNが保有する登録商標です。(商標登録番号第5388735号)