TOON (Token-Oriented Object Notation) is a data serialization format designed specifically for LLM prompts to be highly efficient. It dramatically reduces token usage by 30-60% compared to JSON while remaining structured and human-readable. By using a tabular format for arrays and minimal syntax for objects, TOON makes your data cheaper and faster to process with AI models.

What's the difference between TOON and JSON?

The key difference is token efficiency. JSON is verbose, with brackets, quotes, and commas that consume tokens. TOON is a more compact syntax designed for LLMs, representing arrays as tables with headers and using minimal punctuation. This efficiency directly translates to significant cost savings on your LLM API bills, especially for large or repeated datasets.

How much can I save with TOON?

You can typically expect to save 30-60% on LLM tokens compared to using JSON. For large datasets or frequent API calls, this translates directly into significant cost savings. Data with repeated structures, like API responses or database results, often sees savings at the higher end of this range (40-60%).

Is TOON compatible with all LLMs?

Yes. TOON is a simple text format that works flawlessly with all major large language models, including those from OpenAI (GPT-4), Anthropic (Claude), Google (Gemini), and Meta (LLaMA). Since any LLM can process plain text, they can all be instructed to understand and parse the TOON format with a simple instruction in your prompt.

Can I convert TOON back to JSON?

Absolutely. TOON is fully and losslessly reversible. Our converter tool supports bidirectional conversion, meaning you can convert TOON back to the exact original JSON structure without any data loss. This allows you to use TOON for efficiency and then convert back to JSON for compatibility with other tools.

What types of data work best with TOON?

TOON can represent any valid JSON data, but it delivers the highest token savings (40-60%) on uniform tabular data. This includes database query results, API responses with lists of objects, analytics data, or product catalogs. While TOON fully supports nested objects and arrays, the token reduction is most dramatic with flatter, more repetitive data structures.

Is my data safe when using this converter?

100% safe. All conversion from JSON to TOON (and back) happens locally in your browser. Your data is never sent to any server, never stored, and never seen by us. The converter even works offline once the page has loaded, guaranteeing your information remains private.

Yes, completely free. Both this TOON converter and the underlying TOON format specification are open and free to use without any limits, file size restrictions, or premium features. It's an open-source effort to make working with LLMs more efficient for everyone.

Jak używać TOON z LLM

LLM

Szybka inżynieria

Jeśli kiedykolwiek wkleiłeś dużą tablicę JSON do ChatGPT lub Claude, prawdopodobnie odczułeś ból związany z zamykaniem się okna kontekstowego. JSON jest fantastyczny w przypadku internetowych interfejsów API, ale w przypadku dużych modeli językowych (LLM) jest niezwykle marnotrawny. Powtarzanie nazw pól, takich jak ``id":, "name":i"timestamp":` dla każdego rekordu nie jest po prostu zbędne; przepala tokeny, które kosztują prawdziwe pieniądze i cenną przestrzeń kontekstową.

Tutaj błyszczy TOON (notacja obiektów tabelarycznych). To nie jest tylko format danych; jest to strategia optymalizacji interakcji LLM. Usuwając podatek składniowy JSON i dodając jawne nagłówki struktur, TOON umożliwia przekazywanie większej ilości danych do modeli i uzyskiwanie w zamian bardziej niezawodnych ustrukturyzowanych wyników.

Ekonomia symboliczna TOON

Po co zawracać sobie głowę zmianą formatów? Matematyka jest prosta. W standardowej tablicy obiektów JSON schemat jest powtarzany dla każdego wiersza. Jeśli masz listę 50 użytkowników, płacisz za nazwy pól 50 razy.

TOON eliminuje tę nadmiarowość, deklarując schemat raz w nagłówku. Dane są przesyłane w gęstym, opływowym formacie. W praktyce zazwyczaj skutkuje to 30–60% redukcją użycia tokenu w przypadku jednolitych tablic w porównaniu do sformatowanego JSON. Kiedy masz do czynienia z ogromnymi oknami kontekstowymi lub dużą liczbą wywołań API, wydajność ta przekłada się bezpośrednio na niższe rachunki i mniejsze opóźnienia.

Wysyłanie danych: zasada „Pokaż, nie mów”.

Kiedy potrzebujesz LLM do analizy danych, Twoja szybka strategia ma kluczowe znaczenie. Początkujący często piszą długie akapity wyjaśniające format danych. Dzięki TOON nie musisz tego robić.

LLM to silniki dopasowujące wzorce. Intuicyjnie rozumieją TOON, ponieważ wygląda jak hybryda formatów YAML i CSV, które widzieli miliardy razy podczas szkoleń.

Aby wysłać dane, po prostu zawiń je w chroniony blok kodu. Możesz oznaczyć go etykietą „toon”, ale nawet jeśli podświetlanie składni modelu oficjalnie go nie obsługuje, model natychmiast rozumie strukturę.

Przykład wejścia

Zamiast opisywać schemat wystarczy podać blok:

Nagłówek „users[3]{id,name,role,lastLogin}” przekazuje modelowi wszystko, co powinien wiedzieć: typ jednostki, liczbę (3 wiersze) i kolejność pól. Wcięcie obsługuje hierarchię. Ta „samodokumentująca się” natura pozwala skupić się na rzeczywistym zadaniu logicznym, a nie na instrukcjach analizowania składni.

Oto dziennik aktywności użytkownika. Dane są w formacie TOON (wcięcie 2 spacje, wyraźne nagłówki). 

użytkownicy[3]{id, nazwa, rola, ostatnie logowanie}: 
1,Alicja,admin,2025-01-15T10:30:00Z 
2,Bob,użytkownik,2025-01-14T15:22:00Z 
3, Charlie, użytkownik, 2025-01-13T09:45:00Z 

Zadanie: Przeanalizuj logi i zidentyfikuj, którzy użytkownicy nie logowali się w ciągu ostatnich 24 godzin.

Generowanie niezawodnych wyników

Uzyskanie LLM do odczytu danych jest łatwe; najtrudniejszą częścią jest uzyskanie wygenerowania prawidłowych danych strukturalnych. Modele uwielbiają mieć halucynacje, obcinać JSON lub zapominać o zamykających nawiasach klamrowych.

TOON dodaje warstwę bezpieczeństwa poprzez składnię nagłówka, w szczególności liczbę „[N]”. Kiedy prosisz model o wygenerowanie danych wyjściowych TOON, prosisz go o zatwierdzenie struktury przed wygenerowaniem danych.

Monitowanie o wygenerowanie

Aby uzyskać najlepsze wyniki, podaj oczekiwany format nagłówka i poinstruuj model, aby wypełnił wiersze.

Prosząc model o obliczenie „[N]”, wymuszasz proces „łańcucha myślowego”, w którym model musi zaplanować rozmiar wyjściowy. To pozornie małe ograniczenie znacznie zmniejsza prawdopodobieństwo, że model przestanie działać w połowie listy.

Zadanie: Zwróć listę aktywnych użytkowników z rolą „użytkownik”. 
Format: użyj TOON. Ustaw wartość [N] w nagłówku, aby odpowiadała dokładnej liczbie wygenerowanych wierszy. 

Oczekiwany format: 
użytkownicy [N] {id, nazwa, rola, ostatnie logowanie}:

Sprawdzanie w trybie ścisłym

Kiedy otrzymasz odpowiedź od LLM, nie powinieneś po prostu jej ufać. W tym miejscu tryb ścisły biblioteki TOON staje się supermocą w zastosowaniach produkcyjnych.

Jeśli używasz biblioteki TypeScript, dekodowanie w trybie ścisłym sprawdza, czy wygenerowane wiersze odpowiadają liczbie nagłówków:

Umożliwia to programowe wychwytywanie natychmiastowych wyników „leniwego” modelu lub obcięć sieci, zamiast odkrywania błędnych danych w dalszej części aplikacji.

importuj { dekoduj } z '@toon-format/toon'; 

spróbuj { 
// Jeśli model podaje [5], ale podaje 4 wiersze, zgłasza to błąd. 
const data = decode(modelOutput, { strict: true }); 
console.log('Otrzymano prawidłowe dane:', dane); 
} złapać (błąd) { 
console.error('Wykryto halucynację lub obcięcie modelu:', error.message); 
}

Zaawansowana optymalizacja: sztuczka z zakładkami

Jeśli masz obsesję na punkcie optymalizacji (a w świecie LLM prawdopodobnie powinieneś mieć), możesz wycisnąć jeszcze większą wydajność, mądrze wybierając ograniczniki.

Przecinki są standardem, ale tabulatory (\t) są często reprezentowane jako pojedynczy token w wielu słownikach tokenizerów. Co więcej, tabulatory rzadko pojawiają się w naturalnych polach tekstowych, co ogranicza potrzebę stosowania znaków ucieczki (takich jak zawijanie ciągów znaków w cudzysłów).

Możesz zakodować swoje dane za pomocą zakładek przed wysłaniem ich do modela:

Pamiętaj tylko o poinformowaniu modelu w wierszu zachęty: "Dane są rozdzielane tabulatorami TOON." Tworzy to niezwykle zwartą reprezentację, która jest niezwykle łatwa do przeanalizowania i wygenerowania przez model.

const toonPrompt = encode(data, { ogranicznik: '\t' });

Kompletny przykład przepływu pracy

Spójrzmy na scenariusz ze świata rzeczywistego: filtrowanie dzienników systemowych. Chcesz wysłać surowe logi do modelu i uzyskać uporządkowaną listę błędów.

Podpowiedź:

Wyjście modelu:

Logi systemowe w formacie TOON (oddzielone tabulatorami): 

wydarzenia[4]{id,poziom,wiadomość,znacznik czasu}: 
1, błąd, przekroczono limit czasu połączenia, 2025-01-15T10:00:00Z 
2, ostrzegaj, wolne zapytanie, 2025-01-15T10:05:00Z 
3,informacje,Logowanie użytkownika,2025-01-15T10:10:00Z 
4,błąd,błąd bazy danych025-01-15T10:15:00Z 

Zadanie: Wyodrębnij wszystkie zdarzenia z poziomem „błąd”. Zwróć wynik jako prawidłowy TOON ze zaktualizowaną liczbą nagłówków.

Wynik:

„Toon wydarzenia[2]{id,poziom,wiadomość,znacznik czasu}: 1, błąd, przekroczono limit czasu połączenia, 2025-01-15T10:00:00Z 4, błąd, błąd bazy danych, 2025-01-15T10:15:00Z

Model poprawnie przefiltrował listę i, co najważniejsze, zaktualizował nagłówek do events[2]. Dekodując tę odpowiedź, otrzymasz czystą, bezpieczną dla typu tablicę, gotową dla logiki aplikacji.

Streszczenie

TOON wypełnia lukę pomiędzy czytelnością dla człowieka a wydajnością maszyn. Respektuje ograniczenia kosztowe LLM, zapewniając jednocześnie strukturę wymaganą do niezawodnego tworzenia oprogramowania.

Pamiętaj, żeby był mały: Użyj 2–5 wierszy w swoich przykładach; model będzie generalizował.

Wyraźnie określ: Jasno zdefiniuj nagłówki, aby model znał schemat.

Weryfikuj ściśle: Użyj metadanych formatu, aby wychwycić błędy generowania.

Odchodząc od JSON w przypadku szybkich ładunków, nie tylko oszczędzasz tokeny — budujesz bardziej niezawodny potok AI.