TOON (Token-Oriented Object Notation) is a data serialization format designed specifically for LLM prompts to be highly efficient. It dramatically reduces token usage by 30-60% compared to JSON while remaining structured and human-readable. By using a tabular format for arrays and minimal syntax for objects, TOON makes your data cheaper and faster to process with AI models.

What's the difference between TOON and JSON?

The key difference is token efficiency. JSON is verbose, with brackets, quotes, and commas that consume tokens. TOON is a more compact syntax designed for LLMs, representing arrays as tables with headers and using minimal punctuation. This efficiency directly translates to significant cost savings on your LLM API bills, especially for large or repeated datasets.

How much can I save with TOON?

You can typically expect to save 30-60% on LLM tokens compared to using JSON. For large datasets or frequent API calls, this translates directly into significant cost savings. Data with repeated structures, like API responses or database results, often sees savings at the higher end of this range (40-60%).

Is TOON compatible with all LLMs?

Yes. TOON is a simple text format that works flawlessly with all major large language models, including those from OpenAI (GPT-4), Anthropic (Claude), Google (Gemini), and Meta (LLaMA). Since any LLM can process plain text, they can all be instructed to understand and parse the TOON format with a simple instruction in your prompt.

Can I convert TOON back to JSON?

Absolutely. TOON is fully and losslessly reversible. Our converter tool supports bidirectional conversion, meaning you can convert TOON back to the exact original JSON structure without any data loss. This allows you to use TOON for efficiency and then convert back to JSON for compatibility with other tools.

What types of data work best with TOON?

TOON can represent any valid JSON data, but it delivers the highest token savings (40-60%) on uniform tabular data. This includes database query results, API responses with lists of objects, analytics data, or product catalogs. While TOON fully supports nested objects and arrays, the token reduction is most dramatic with flatter, more repetitive data structures.

Is my data safe when using this converter?

100% safe. All conversion from JSON to TOON (and back) happens locally in your browser. Your data is never sent to any server, never stored, and never seen by us. The converter even works offline once the page has loaded, guaranteeing your information remains private.

Yes, completely free. Both this TOON converter and the underlying TOON format specification are open and free to use without any limits, file size restrictions, or premium features. It's an open-source effort to make working with LLMs more efficient for everyone.

LLM で TOON を使用する方法

LLM

迅速なエンジニアリング

大きな JSON 配列を ChatGPT または Claude に貼り付けたことがある場合は、コンテキストウィンドウが閉じてしまう苦痛を感じたことがあるでしょう。JSON は Web API にとっては素晴らしいものですが、Large Language Model (LLM) にとっては信じられないほど無駄です。 "id":、"name":、および "timestamp": などのフィールド名をレコードごとに繰り返すのは、単に冗長であるだけではありません。リアルマネーと貴重なコンテキストスペースを必要とするトークンを焼き尽くします。

ここで TOON (Table Object Notation) が威力を発揮します。これは単なるデータ形式ではありません。これは、LLM インタラクションを最適化するための戦略です。 JSON の構文を取り除き、明示的な構造ヘッダーを追加することで、TOON を使用すると、より多くのデータをモデルに渡し、その代わりにより信頼性の高い構造化された出力を取得できるようになります。

TOONのトークンエコノミクス

なぜフォーマットをわざわざ切り替える必要があるのでしょうか? 計算は簡単です。オブジェクトの標準的な JSON 配列では、行ごとにスキーマが繰り返されます。 50 人のユーザーのリストがある場合、フィールド名の料金を 50 回支払うことになります。

TOON は、ヘッダー内でスキーマを 1 回宣言することで、この冗長性を排除します。データは、緻密で合理的な形式で続きます。実際には、これにより通常、フォーマットされた JSON と比較して均一配列のトークン使用量が 30 ～ 60% 削減されます。大規模なコンテキストウィンドウや大量の API 呼び出しを処理する場合、その効率はそのまま請求額の削減と待ち時間の短縮につながります。

データの送信: 「伝えるな、見せる」ルール

データ分析に LLM が必要な場合、迅速な戦略が重要です。初心者はデータ形式を説明する長い文章を書くことがよくあります。 TOON を使用すると、その必要はありません。

LLM はパターンマッチングエンジンです。彼らは、TOON が YAML と CSV のハイブリッドのように見えるため、直感的に理解できます。これは、トレーニング中に何十億回も見たフォーマットです。

データを送信するには、フェンスで囲まれたコードブロックでデータをラップするだけです。これに「トゥーン」というラベルを付けることもできますが、モデルの構文ハイライトが正式にサポートしていなくても、モデルは構造をすぐに理解します。

入力例

スキーマを説明する代わりに、ブロックを指定するだけです。

ヘッダー users[3]{id,name,role,lastLogin} は、エンティティタイプ、数 (3 行)、およびフィールドの順序など、モデルが知る必要があるすべてをモデルに伝えます。インデントは階層を処理します。この「自己文書化」の性質により、プロンプトは構文解析命令ではなく実際のロジックタスクに集中できるようになります。

``md ユーザーのアクティビティログは次のとおりです。データは TOON 形式 (2 スペースのインデント、明示的なヘッダー) です。

ユーザー[3]{ID、名前、役割、最終ログイン}: 1、アリス、管理者、2025-01-15T10:30:00Z 2、ボブ、ユーザー、2025-01-14T15:22:00Z 3、チャーリー、ユーザー、2025-01-13T09:45:00Z

タスク: ログを分析し、過去 24 時間以内にログインしていないユーザーを特定します。「」

信頼性の高い出力の生成

LLM でデータを読み取るのは簡単です。有効な構造化データを_生成_するのは難しい部分です。モデルは幻覚を見せたり、JSON を切り詰めたり、右中括弧を忘れたりするのが大好きです。

TOON は、ヘッダー構文、特に [N] カウントを通じて安全層を追加します。モデルに TOON を出力するよう依頼すると、データを生成する前に構造にコミットするようモデルに依頼することになります。

生成のプロンプト

最良の結果を得るには、期待するヘッダー形式を指定し、行を埋めるようにモデルに指示します。

モデルに [N] の計算を依頼することで、モデルが出力サイズを計画する必要がある「思考の連鎖」プロセスを強制します。この一見小さな制約により、モデルがリストの途中で切断される可能性が大幅に減少します。

``md タスク: ロール「user」を持つアクティブなユーザーのリストを返します。形式: TOON を使用します。生成する行数と正確に一致するようにヘッダーの [N] 値を設定します。

期待される形式: ユーザー[N]{id,name,role,lastLogin}: 「」

Strict モードでの検証

LLM から応答を受け取った場合、それをただ信頼する必要はありません。ここで、TOON ライブラリの厳密モードが運用アプリケーションにとって強力になります。

TypeScript ライブラリを使用している場合、厳密モードでデコードすると、生成された行がヘッダー数と一致するかどうかが検証されます。

これにより、アプリケーションの下流で不正なデータを検出するのではなく、「遅延」モデルの出力やネットワークの切り捨てをプログラムで即座に捕捉できるようになります。

 import { decode } から '@toon-format/toon';

 {を試してください
 // モデルに [5] と表示されていても 4 行がある場合、エラーがスローされます。 
const data = decode(modelOutput, { strict: true });
 console.log('有効なデータを受信しました:', data);
 } キャッチ (エラー) {
 console.error('モデルの幻覚または切り捨てが検出されました:', error.message);
 }
 「」

高度な最適化: タブのトリック

最適化に夢中になっている場合 (LLM の世界では、おそらくそうすべきでしょう)、区切り文字を賢く選択することで、さらに効率を高めることができます。

カンマは標準ですが、多くのトークナイザー語彙ではタブ (\t) が単一のトークンとして表されることがよくあります。さらに、タブがナチュラルテキストフィールド内に表示されることはほとんどないため、エスケープ文字 (文字列を引用符で囲むなど) の必要性が減ります。

データをモデルに送信する前に、タブを使用してデータをエンコードできます。

プロンプトでモデルに次のように通知することを忘れないでください: 「データはタブで区切られた TOON.」 これにより、モデルの解析と生成が非常に簡単になる超コンパクトな表現が作成されます。

 const toonPrompt = encode(data, { 区切り文字: '\t' });
 「」

完全なワークフローの例

実際のシナリオ、つまりシステムログのフィルタリングを見てみましょう。生のログをモデルに送信し、構造化されたエラーのリストを取得したいと考えています。

プロンプト:

モデルの出力:

``md TOON 形式のシステムログ (タブ区切り):

イベント[4]{ID、レベル、メッセージ、タイムスタンプ}: 1、エラー、接続タイムアウト、2025-01-15T10:00:00Z 2、警告、遅いクエリ、2025-01-15T10:05:00Z 3、情報、ユーザーログイン、2025-01-15T10:10:00Z 4、エラー、データベースエラー025-01-15T10:15:00Z

タスク: レベル「エラー」を持つすべてのイベントを抽出します。更新されたヘッダー数を持つ有効な TOON として結果を返します。「」

結果：

「トゥーン」イベント[2]{ID、レベル、メッセージ、タイムスタンプ}: 1、エラー、接続タイムアウト、2025-01-15T10:00:00Z 4、エラー、データベースエラー、2025-01-15T10:15:00Z 「」

モデルはリストを正しくフィルタリングし、重要なことに、ヘッダーを「events[2]」に更新しました。この応答をデコードすると、アプリケーションロジックに使用できるクリーンでタイプセーフな配列が得られます。

＃＃まとめ

TOON は、人間の読みやすさと機械の効率の間のギャップを埋めます。 LLM のコスト制約を尊重しながら、堅牢なソフトウェア開発に必要な構造を提供します。

規模を小さくしてください: 例では 2 ～ 5 行を使用します。モデルは一般化されます。

明示的であること: モデルがスキーマを認識できるように、ヘッダーを明確に定義します。

厳密に検証します: 形式のメタデータを使用して生成エラーを検出します。

プロンプトペイロードを JSON から移行することで、トークンを節約するだけでなく、より信頼性の高い AI パイプラインを構築できます。