試運転の資料館
玄関 総合案内 電算機部 営繕部 交通部 リンク

This web site is only compatible with Japanese text.

CAD データの文字化け現象


まずは、以下をご覧ください。

参考写真-1 jpegファイル

参考写真-2 jpegファイル

よくありがちな、CAD データを変換した時の文字化けです。1 枚目は某 A が付く CAD 、2 枚目は某 J が付く CAD で、この DXF データを開いた時の文字化けです。

一般に、CAD データの文字列は、フォントに MS ゴシックを使用すれば文字化けは起きない、という認識があります。

この認識は間違いではありません。CAD 独自のフォントを使用してあるCAD データを変換して、違う CAD で読み込ませると激しく文字化けしますが、MS ゴシックの様に CAD に限らず、色々なソフトウェアで共通で使用できるフォントを使用していれば、余り文字化けには遭遇しません。

しかし、MS ゴシックを使用していても文字化けしてるように見える事があります。これは文字コードが関係しています。


昔からウェブサイトを運営されている方であればご存じだと思いますが日本語の様な 2byte 文字では、複数の文字コードが存在しています。

日本語の代表的な文字コードとして、昔から使用されている Shift_JIS と、2005 年頃から普及し始めた Unicode があり、上記の DXF データは、2 種類の文字コードが混在している為に、文字化けしているように見えているのです。


某 A が付く CAD のバージョン 2007 以降で文字を記入した DXF データは、文字列は強制的に Unicode が使用されています。しかし、某 J が付く CAD では、Shift_JIS しか対応していません。上記の DXF データは、2 行ある文字列のうち、片方を Shift_JIS でもう片方を Unicode で記載しています。

Unicode と、Shift_JIS はひらがなや漢字であれば相互に変換できるので問題なく表示できます。しかし、「×」や「Φ」のように HTML リファレンスで特殊な文字として実体参照コードが定められている文字は、高確率で文字化けします。これは、変換方法の混乱によるものです。


例え DXF データのバージョンを R13 にしていたとしても、2007 以降で文字を入力していると、内部的には Unicode を使った状態です。

よって、某 A が付く CAD のバージョン 2007 以降で文字を記入した DXF データを Shift_JIS しか対応していない CAD で扱う可能性がある場合で、HTML リファレンスで特殊な文字として実体参照コードが定められている記号を用いている場合は、文字化けのおそれがあるので記号を削除する、または直線や円で記号をそれらしく記述する必要がある、と覚えておきましょう。

なお、当ウェブサイト上の CAD データの文字コードは Shift_JIS、フォントは MS ゴシックとしています。


Shift_JIS も Unicode も、もっと正確に記述しようとすると大混乱に陥るので、この場は敢えて簡略化して記述してあります。ですので、細かな記述間違い等はご容赦願います。


indexへ戻る

Copyright (C) 2016 "shiunten"