Treasure Data - Support Engineering Team blog

トレジャーデータのサポートエンジニアリングチームのブログです。

文字コードについて

こんにちは、Treasure Data(TD) サポートの伊藤です。 今回はTDを利用する上で気にすることがあるであろう、文字コードについて取り上げたいと思います。 文字コードとは ASCII(シングルバイト文字) UTF-8 や S-JIS(マルチバイト文字) TDを取り扱う上での文…

Incremental Loading とは

こんにちは、Treasure Data(TD) サポートの伊藤です。 今回は差分インポートするための機能である Incremental Loading 機能について触れようと思います。 差分インポートとは Incremental Loadingを使うには 差分判定ロジックについて 辞書式ソートによる判…

Treasure Data 概要 - Export編

こんにちは、Treasure Data(TD) サポートの伊藤です。 前回のインポート編に続き、エクスポート編として記事を書こうと思います。 インポートとは異なりエクスポートは機能数が少ないので、とっつきやすく読みやすいと思います。 エクスポートとは Result Ex…

Treasure Data 概要 - Import編

こんにちは、Treasure Data(以後TD) サポートの伊藤です。 TDは様々な機能を提供しており、利用者ができることが多岐に渡る反面、施策を実現しようとしたときにどういった選択肢があるのか把握しづらい面があるかと思います。 そこで、今さらではありますが…

Presto Conference Tokyo 2020 (Online) 登壇・参加レポート

Treasure Data サポート上加世田です。 Presto Conference Tokyo 2020 にて登壇しました。 そのレポートと合わせて紹介いたします! Presto Conference Tokyo 2020 (Online) TDにおいてもかなり中心的な機能であるPrestoのカンファレンスです。 昨年はTreasu…

td-toolbeltチュートリアル ちょっとした便利な使い方

こんにちは、Treasure Data サポートの大村です。 今回はすこし横道?にそれて、複数アカウントでのtd-toolbeltの便利な使い方についてご紹介していきたいと思います。 Treasure Dataの環境をずっと同じユーザで使用つづける場合はtd accountコマンドでユー…

td-toolbeltチュートリアル

こんにちは。Treasure Data サポートチームの大村です。今回はコマンドラインによるTDの操作方法についてチュートリアルをご紹介したいと思います。 TDには各種サービスを管理するためのWeb UI(TDコンソール)がありますが、このWeb UIと同等のコマンドライン…

Custom Script開発手順およびデバッグ

こんにちは。Treasure Data 大村です。今回はCustom Scriptの基本的な開発手順およびデバッグについてご紹介していきたいと思います。 Custom Script開発環境構築については前回の記事(Custom Script開発準備)を参照下さい。 プログラム作成 pythonプログ…

Treasure Academyのご紹介

Treasure Data サポートの上加世田です。 2020年4月より、Treasure Dataで初となるTDユーザ様向けの有償トレーニングとしてトレジャーアカデミーを提供開始致しました。 受講できるコースは2つあり、それぞれ修了試験に合格することで修了証を受け取ることが…

Customer Support Tech Meetup #2に登壇してきました。

こんにちは。Treasure Dataサポートエンジニアの佐藤です。 タイトル通りですが、mixiさん主催のCustomer Support Tech Meetupというイベントに参加してきました。 mixi.connpass.com このイベントは「CREがどのようにしてCS課題を解決しているのか?」とい…

Arm Treasure Data で半角文字・全角文字を正規化する方法

Arm Treasure Data の笠井です。 今回は Arm Treasure Data(以下 TD) で半角文字と全角文字を正規化によってうまく扱う方法を紹介します。 結論 とりあえず結論を書きます。 Presto で正規化する場合は normalize 関数*1 を利用する。 Hive では Hivemall …

Custom Script開発準備

こんにちは。Arm Treasure Data サポートチームの大村です。今回は最近使用される方が増えてきたように感じるCustom Scriptの開発準備についてご紹介していきたいと思います。 Custom Scriptとは Treasure Workflowから呼びだすことのできるpythonスクリプト…

Treasure Workflowのsession timeとスケジューリングについて

こんにちは。Arm Treasure Dataでサポートエンジニアとして働いています、佐藤です。 今回は少しイメージとして掴みにくい、Treasure workflowのsession timeのコンセプトに関して少し説明して行こうかと思います。 そもそもTeasure Workflowとは? Treasure…

簡単にTreasure Dataのクエリ(Presto/Hive)の動作確認をするには

こんにちは、Arm Treasure Data サポートの伊藤です。 本記事は2回目のエントリーとなります。 前回はData Connectorと呼ばれる、外部サービス(AWS S3やSFTPサーバーなど)からデータをTreasure Data(TD)へインポートする際のナレッジについて説明しましたが…

Data ConnectorのJobでskipped lineがでる理由

トレジャーデータサポートの橘です。 最初のエントリーを書くことになりやや緊張しております。 このエントリーではよくお問い合わせを受ける想定よりも件数が少ない、または1件もデータがインポートされていないという事象についてお話をしたいと思います。…