作成: 2017-11-05

Haskellのregex-compatはUnicode文字に対応していないのでregex-compat-tdfaを使いましょう

titleWbr = field "title_wbr"
    (\item -> (\mTitle -> R.subRegex (R.mkRegex ",") (fromJust mTitle) ",<wbr>") <$>
        getMetadataField (itemIdentifier item) "title")

のように<wbr>をカンマの後に挿入するようにしたのですが, カンマの存在しない場所に何故かカンマが挿入されてしまったり, 一部の文字が削除されてしまっていることに気がつきました.

何故だろうと思い, 他の正規表現パッケージを見てみることにしました.

regex-compat-tdfa :: Stackage Serverによると,

regex-compat can't use Unicode characters correctly because of using regex-posix. This is not good for Unicode users.

と書いてあります.

regex-compatはUnicode文字を正しく処理できないようですね.

なので, 依存からregex-compatを削除して, regex-compat-tdfaを追加したら正しく処理されるようになりました.

探してみると同じように詰まっていた人が居たようですね. haskell-ja > Archives > 2015/05/04

regex-compatを使うのはやめましょう.

icon	key	value
📛	name	ncaq エヌユル
📧	email	ncaq@ncaq.net
📞	TEL	070-8508-1708
	Twitter	ncaq
	GitHub	ncaq
	Hatena	Haaaa_N
	Discord	ncaq
	Reddit	ncaq
	SYAKERAKE	エヌユル
	Steam	ncaq
	Switch	SW-7455-2842-8308
3	3DS	0860-3192-4401
	Pokémon GO	1866 8646 7299
	PlayStation	ncaq_net
	Xbox	ncaq
	Amazon	ncaq エヌユル
	ほしい物リスト	ncaq main