Treasure Data の笠井です。 今回は Treasure Data(以下 TD) で半角文字と全角文字を正規化によってうまく扱う方法を紹介します。 結論 とりあえず結論を書きます。 Presto で正規化する場合は normalize 関数*1 を利用する。 Hive では Hivemall の関数と…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。