試運転の資料館
玄関 総合案内 電算機部 営繕部 交通部 通信部

This web site is only compatible with Japanese text.

CAD データの文字化け現象


もくじ

はじめに

世の中には様々な CAD が存在していますが、データ形式を変換すると文字化けを起こす事が有ります。まずは、以下をご覧ください。

CAD 上で正常に表示出来た検証画像 ( JPEG 形式 ) が見えない時の代替文。画像は、黒い背景と白抜き文字による顔文字を、上下二行で記載。

CAD 上で文字化けしている検証画像 ( JPEG 形式 ) が見えない時の代替文。画像は、黒い背景と白抜き文字による顔文字を、上下二行で記載。二行目が文字化けしている。

一枚目はオートデスク株式会社の Auto CAD 、二枚目は Jw_cad を使用して、DXF 形式の CAD データを開いた時の文字化けです。

一般に CAD データの文字列は、フォントに MS ゴシックを使用すれば文字化けは起きない、という認識があります。

この認識が間違っている訳ではありません。特定の CAD 独自のフォントを使用している CAD データを変換して、違う CAD で読み込ませると激しく文字化けしますが、MS ゴシックの様に CAD に限らず、色々なソフトウェアで共通で使用できるフォントを使用していれば、余り文字化けには遭遇しません。

しかし、MS ゴシックを使用していても文字化けが発生してしまう場合も有ります。原因の一つとして、文字コードが関係しています。


文字コード

昔からウェブサイトを運営されている方であればご存じだと思いますが、日本語向けの文字コードでは、複数の文字コードが存在しています。

日本語の代表的な文字コードとして、昔から使用されている Shift_JIS と、平成十七年 ( 2005 年 ) 頃から普及し始めた Unicode があり、上記の DXF データは Shift_JIS と Unicode の二種類の文字コードが混在している為に、片方だけ文字化けしています。


文字化けの原因

オートデスク株式会社の Auto CAD は 2007 年版以降で文字を記入した DXF データは、文字列は強制的に Unicode が使用されている様です。しかし、Jw_cad では Shift_JIS しか対応していません。上記の DXF データは、二行ある文字列のうち、片方を Shift_JIS、もう片方を Unicode で記載しています。

Unicode と Shift_JIS は、ひらがなや漢字であれば相互に変換できるので問題なく表示できます。しかし、「×」や「Ø」のように HTML リファレンスで特殊な文字として実体参照コードが定められている文字は、文字化けしやすい様です。これは文字コード間の変換方法の混乱によるものです。


対策方法

例え DXF 形式の CAD データのバージョンを古い形式で保存した場合でも、CAD 側で強制的に Unicode を使われてしまっては、文字化けを抑える事が出来ません。例えば、オートデスク株式会社の Auto CAD の 2007 年版以降で文字を入力すると、強制的に Unicode を使用した状態になる様です。

よって、製作する CAD データを Shift_JIS のみ対応の CAD で扱う事が分かっている場合、特に HTML リファレンスで文字参照用のコードが定められている記号は、記号自体を削除または変更する、もしくは直線や円で記号をそれらしく記述した方が文字化けの心配をせずに済む、と覚えておきましょう。

なお、当ウェブサイト上の DXF 形式の CAD データは、文字コードは使用している CAD の都合上 Unicode とし、フォントは MS ゴシックとしています。


おわりに

Shift_JIS も Unicode も正確に記述しようとすると大混乱に陥るので、この場は可能な限り簡略化して記述してあります。ですので、正確性に欠ける記述が有ったとしてもご容赦願います。


参考文献


玄関へ戻る

Copyright (C) 2013 "shiunten"