TOON (Token-Oriented Object Notation) is a data serialization format designed specifically for LLM prompts to be highly efficient. It dramatically reduces token usage by 30-60% compared to JSON while remaining structured and human-readable. By using a tabular format for arrays and minimal syntax for objects, TOON makes your data cheaper and faster to process with AI models.

What's the difference between TOON and JSON?

The key difference is token efficiency. JSON is verbose, with brackets, quotes, and commas that consume tokens. TOON is a more compact syntax designed for LLMs, representing arrays as tables with headers and using minimal punctuation. This efficiency directly translates to significant cost savings on your LLM API bills, especially for large or repeated datasets.

How much can I save with TOON?

You can typically expect to save 30-60% on LLM tokens compared to using JSON. For large datasets or frequent API calls, this translates directly into significant cost savings. Data with repeated structures, like API responses or database results, often sees savings at the higher end of this range (40-60%).

Is TOON compatible with all LLMs?

Yes. TOON is a simple text format that works flawlessly with all major large language models, including those from OpenAI (GPT-4), Anthropic (Claude), Google (Gemini), and Meta (LLaMA). Since any LLM can process plain text, they can all be instructed to understand and parse the TOON format with a simple instruction in your prompt.

Can I convert TOON back to JSON?

Absolutely. TOON is fully and losslessly reversible. Our converter tool supports bidirectional conversion, meaning you can convert TOON back to the exact original JSON structure without any data loss. This allows you to use TOON for efficiency and then convert back to JSON for compatibility with other tools.

What types of data work best with TOON?

TOON can represent any valid JSON data, but it delivers the highest token savings (40-60%) on uniform tabular data. This includes database query results, API responses with lists of objects, analytics data, or product catalogs. While TOON fully supports nested objects and arrays, the token reduction is most dramatic with flatter, more repetitive data structures.

Is my data safe when using this converter?

100% safe. All conversion from JSON to TOON (and back) happens locally in your browser. Your data is never sent to any server, never stored, and never seen by us. The converter even works offline once the page has loaded, guaranteeing your information remains private.

Yes, completely free. Both this TOON converter and the underlying TOON format specification are open and free to use without any limits, file size restrictions, or premium features. It's an open-source effort to make working with LLMs more efficient for everyone.

Cum să utilizați TOON cu LLM-uri

LLM

Inginerie promptă

Dacă ați inserat vreodată o matrice JSON mare în ChatGPT sau Claude, probabil că ați simțit durerea închiderii ferestrei de context. JSON este fantastic pentru API-urile web, dar pentru modelele de limbaj mari (LLM), este incredibil de irositor. Repetarea numelor de câmp precum "id":, "name": și "timestamp": pentru fiecare înregistrare nu este doar redundantă; arde prin jetoane care costă bani reali și spațiu de context valoros.

Aici strălucește TOON (Table Object Notation). Nu este doar un format de date; este o strategie de optimizare a interacțiunilor LLM. Prin eliminarea taxei de sintaxă a JSON și adăugarea antetelor de structură explicite, TOON vă permite să transmiteți mai multe date modelelor dvs. și să obțineți în schimb rezultate structurate mai fiabile.

Economia de simboluri a TOON

De ce să vă deranjați să schimbați formatele? Matematica este simplă. Într-o matrice JSON standard de obiecte, schema se repetă pentru fiecare rând. Dacă aveți o listă de 50 de utilizatori, plătiți pentru numele câmpurilor de 50 de ori.

TOON elimină această redundanță declarând schema o dată în antet. Datele urmează într-un format dens, raționalizat. În practică, acest lucru are ca rezultat, de obicei, o reducere de 30-60% a utilizării token-ului pentru matrice uniforme, comparativ cu JSON formatat. Când aveți de-a face cu ferestre de context masive sau apeluri API cu volum mare, acea eficiență se traduce direct în facturi mai mici și latență mai mică.

Trimiterea datelor: regula „Arată, nu spune”.

Când aveți nevoie de un LLM pentru a analiza datele, strategia dumneavoastră promptă este crucială. Începătorii scriu adesea paragrafe lungi explicând formatul datelor. Cu TOON, nu trebuie să faci asta.

LLM-urile sunt motoare de potrivire a modelelor. Ei înțeleg intuitiv TOON pentru că arată ca un hibrid de YAML și CSV - formate pe care le-au văzut de miliarde de ori în timpul antrenamentului.

Pentru a trimite date, pur și simplu împachetați-le într-un bloc de cod îngrădit. Îl puteți eticheta „toon”, dar chiar dacă evidențiatorul de sintaxă al modelului nu îl acceptă oficial, modelul înțelege imediat structura.

Exemplu de intrare

În loc să descrieți schema, furnizați doar blocul:

Antetul utilizatori[3]{id,nume,rol,lastLogin} spune modelului tot ce trebuie să știe: tipul de entitate, numărul (3 rânduri) și ordinea câmpurilor. Indentarea se ocupă de ierarhie. Această natură de „auto-documentare” vă eliberează solicitarea de a vă concentra pe sarcina logică reală, mai degrabă decât instrucțiunile de analiză a sintaxei.

Iată jurnalul de activitate al utilizatorului. Datele sunt în format TOON (indentare cu două spații, anteturi explicite). 

utilizatori[3]{id,nume,rol,lastLogin}: 
1,Alice,admin,2025-01-15T10:30:00Z 
2,Bob,utilizator,2025-01-14T15:22:00Z 
3,Charlie,utilizator,2025-01-13T09:45:00Z 

Sarcină: Analizați jurnalele și identificați ce utilizatori nu s-au conectat în ultimele 24 de ore.

Generarea de rezultate de încredere

Este ușor să obțineți un LLM pentru a citi date; a face să genereze date structurate valide este partea grea. Modelelor le place să halucineze, să trunchieze JSON sau să uite de închiderea bretelelor.

TOON adaugă un strat de siguranță prin sintaxa antetului său, în special numărul „[N]”. Când cereți unui model să scoată TOON, îi cereți să se angajeze într-o structură înainte de a genera datele.

Solicitarea generației

Pentru a obține cele mai bune rezultate, furnizați formatul antetului pe care îl așteptați și instruiți modelul să umple rândurile.

Cerând modelului să calculeze [N], forțați un proces de „lanț de gândire” în care modelul trebuie să planifice dimensiunea ieșirii. Această constrângere aparent mică reduce semnificativ probabilitatea ca modelul să se întrerupă la jumătatea unei liste.

Sarcină: returnați o listă de utilizatori activi cu rolul „utilizator”. 
Format: Folosiți TOON. Setați valoarea [N] din antet pentru a se potrivi cu numărul exact de rânduri pe care le generați. 

Format așteptat: 
utilizatori[N]{id,nume,rol,lastLogin}:

Validarea cu modul strict

Când primiți răspunsul de la LLM, nu trebuie doar să aveți încredere în el. Aici modul strict al bibliotecii TOON devine o superputere pentru aplicațiile de producție.

Dacă utilizați biblioteca TypeScript, decodarea cu modul strict validează faptul că rândurile generate se potrivesc cu numărul antetului:

Acest lucru vă permite să capturați imediat ieșirile modelului „leneș” sau trunchiările rețelei în mod programatic, în loc să descoperiți date proaste în aval în aplicația dvs.

import { decode } din „@toon-format/toon”; 

incearca { 
// Dacă modelul spune [5], dar furnizează 4 rânduri, aceasta aruncă o eroare. 
const data = decode(modelOutput, { strict: true }); 
console.log('Date valide primite:', date); 
} captură (eroare) { 
console.error('Halucinație sau trunchiere a modelului detectată:', error.message); 
}

Optimizare avansată: trucul Tab

Dacă sunteți obsedat de optimizare (și în lumea LLM-urilor, probabil că ar trebui să fiți), puteți obține și mai multă eficiență alegându-vă delimitatorii cu înțelepciune.

Virgulele sunt standard, dar filele (\t) sunt adesea reprezentate ca un singur simbol în multe vocabulare tokenizer. În plus, filele apar rar în câmpurile de text naturale, ceea ce reduce nevoia de caractere de escape (cum ar fi împachetarea șirurilor de caractere între ghilimele).

Vă puteți codifica datele folosind file înainte de a le trimite modelului:

Nu uitați să informați modelul în prompt: "Datele sunt TOON separate de tabulatori." Acest lucru creează o reprezentare hiper-compactă care este incredibil de ușor de analizat și generat de model.

const toonPrompt = encode(date, { delimiter: '\t' });

Un exemplu complet de flux de lucru

Să ne uităm la un scenariu real: filtrarea jurnalelor de sistem. Doriți să trimiteți jurnalele brute către model și să primiți înapoi o listă structurată de erori.

Promptul:

Ieșirea modelului:

Jurnalele de sistem în format TOON (separate prin file): 

evenimente[4]{id,level,message,timestamp}: 
1, eroare, expirare conexiune, 2025-01-15T10:00:00Z 
2, avertisment, interogare lentă, 2025-01-15T10:05:00Z 
3,informații,autentificarea utilizatorului,2025-01-15T10:10:00Z 
4,eroare,Eroare bază de date025-01-15T10:15:00Z 

Sarcină: Extrageți toate evenimentele cu nivelul „eroare”. Returnați rezultatul ca TOON valid cu un număr de antet actualizat.

Rezultatul:

evenimente[2]{id,level,message,timestamp}: 
1, eroare, expirare conexiune, 2025-01-15T10:00:00Z 
4,eroare,Eroare bază de date,2025-01-15T10:15:00Z

Modelul a filtrat corect lista și, în mod crucial, a actualizat antetul la „evenimente[2]”. Prin decodificarea acestui răspuns, obțineți o matrice curată, sigură pentru tipare, pregătită pentru logica aplicației dvs.

Rezumat

TOON face o punte între lizibilitatea umană și eficiența mașinii. Respectă constrângerile de cost ale LLM-urilor, oferind în același timp structura necesară dezvoltării software robuste.

Păstrați-l mic: Folosiți 2-5 rânduri în exemplele dvs.; modelul se va generaliza.

Fii explicit: Definiți anteturile în mod clar, astfel încât modelul să cunoască schema.

Validați strict: utilizați metadatele formatului pentru a detecta erorile de generare.

Îndepărtându-vă de JSON pentru sarcinile utile prompte, nu salvați doar jetoane, ci construiți o conductă AI mai fiabilă.