Perlテックブログ

ITエンジニアの成長意欲を刺激する技術考察、モジュール開発の日記。Perlイベントや国内や海外のPerlの記事の紹介。

UTF8とUnicodeコードポイント、UnicodeコードポイントとUTF-16の相互変換 - SPVM開発日記

SPVMの文字コードUTF-8にしようと考えている。

Webの標準的な文字コードUTF-8である。

Windowsの標準文字コードは、日本語環境だとcp932だが、内部的には、UTF-16で処理されているらしい。

とすると、UTF-8Unicodeコードポイント、UnicodeコードポイントとUTF-16の相互変換が、SPVMの標準機能でできれば、大丈夫そうかな。

UnicodeのコードポイントとUTF-8はアルゴリズムで変換できるのね - SPVM開発日記

文字コードUnicodeUTF-8について調べていた。

UTF-8の文字列で、文字の長さの取得方法、一文字づつ取得するのってどうするんだろうって動機で。

UnicodeのコードポイントとUTF-8アルゴリズムで変換できるみたいね。

そうすると、文字列リテラルで、Unicodeコードポイントで表現して、UTF-8に変換するというのもできそう。

SPVMの仕様策定へ向けて - SPVM開発日記

SPVMの仕様を確定するために、ドキュメントと試験を並行して書いていく。

最初は、未定義値と整数リテラル

ドキュメントはこちら。

SPVM公式ドキュメント 1.0 ベータ