TOON (Token-Oriented Object Notation) is a data serialization format designed specifically for LLM prompts to be highly efficient. It dramatically reduces token usage by 30-60% compared to JSON while remaining structured and human-readable. By using a tabular format for arrays and minimal syntax for objects, TOON makes your data cheaper and faster to process with AI models.

What's the difference between TOON and JSON?

The key difference is token efficiency. JSON is verbose, with brackets, quotes, and commas that consume tokens. TOON is a more compact syntax designed for LLMs, representing arrays as tables with headers and using minimal punctuation. This efficiency directly translates to significant cost savings on your LLM API bills, especially for large or repeated datasets.

How much can I save with TOON?

You can typically expect to save 30-60% on LLM tokens compared to using JSON. For large datasets or frequent API calls, this translates directly into significant cost savings. Data with repeated structures, like API responses or database results, often sees savings at the higher end of this range (40-60%).

Is TOON compatible with all LLMs?

Yes. TOON is a simple text format that works flawlessly with all major large language models, including those from OpenAI (GPT-4), Anthropic (Claude), Google (Gemini), and Meta (LLaMA). Since any LLM can process plain text, they can all be instructed to understand and parse the TOON format with a simple instruction in your prompt.

Can I convert TOON back to JSON?

Absolutely. TOON is fully and losslessly reversible. Our converter tool supports bidirectional conversion, meaning you can convert TOON back to the exact original JSON structure without any data loss. This allows you to use TOON for efficiency and then convert back to JSON for compatibility with other tools.

What types of data work best with TOON?

TOON can represent any valid JSON data, but it delivers the highest token savings (40-60%) on uniform tabular data. This includes database query results, API responses with lists of objects, analytics data, or product catalogs. While TOON fully supports nested objects and arrays, the token reduction is most dramatic with flatter, more repetitive data structures.

Is my data safe when using this converter?

100% safe. All conversion from JSON to TOON (and back) happens locally in your browser. Your data is never sent to any server, never stored, and never seen by us. The converter even works offline once the page has loaded, guaranteeing your information remains private.

Yes, completely free. Both this TOON converter and the underlying TOON format specification are open and free to use without any limits, file size restrictions, or premium features. It's an open-source effort to make working with LLMs more efficient for everyone.

TOON Neden Diğer Formatlardan Daha İyi Performans Gösteriyor?

Yüksek Lisans

Karşılaştırmalar

paçavra

Yüksek Lisans uygulamaları, özellikle de büyük veri kümeleri tüketen Alma-Artırılmış Üretim (RAG) sistemleri veya aracıları oluşturuyorsanız, muhtemelen iki cephede sürekli bir savaşla mücadele ediyorsunuz: belirteç maliyeti ve bağlam penceresi sınırları.

Yıllardır JSON, veri alışverişinde varsayılan ortak dil olmuştur. İnsan tarafından okunabilir (çoğunlukla) ve her yerde bulunur. Ancak 500 satırlık bir JSON dizisini bir bilgi istemine yapıştırdığınızda, belirli bir satır için sıfır anlamsal değer taşıyan tekrarlanan alan adlarına ("id":, "name":, "email":`) binlerce jeton yakıyorsunuz.

TOON girin. LLM girişlerindeki sinyal-gürültü oranı problemini çözmek için özel olarak tasarlanmış bir formattır. En yeni kriterleri inceledim ve sonuçlar şaşırtıcı: TOON yalnızca yerden tasarruf etmekle kalmıyor; aslında GPT-5-nano ve Gemini-2.5-flash gibi modellerin verileri daha iyi anlamasına yardımcı oluyor.

TOON'un neden ağır sıkletleri (JSON, CSV, YAML, XML) geride bıraktığını açıklayalım ve ham sayılara bakalım.

Ayrıntı Tuzağı: JSON ve TOON

Token verimliliğinin en büyük düşmanı yapı tekrarıdır. Standart bir Zaman Serisi Analizi veri kümesine bakalım. JSON'da her veri noktası kendi şemasının bagajını taşır.

JSON (Standart) Kıyaslamada kullanılan jetonlar: 22.250

Bu çok fazla boşa harcanan alandır. Şimdi TOON eşdeğerine bakın. TOON, şemayı başlıkta bir kez tanımlar ve ardından değerler için yoğun, CSV tarzı bir düzene geçer.

TOON Kıyaslamada kullanılan jetonlar: 9.120

Sonuç: Token kullanımında büyük bir %59,0 azalma.

TOON, tekrarlanan tuşları ortadan kaldırarak modelin bağlam penceresine daha fazla geçmiş sığdırmanıza olanak tanır. Ancak en önemlisi, CSV'den farklı olarak, `metrics[5]{...}' başlık tanımı aracılığıyla tür farkındalığını ve açık yapıyı korur.

Neden Sadece CSV Kullanmıyorsunuz?

Bu en yaygın karşı argümandır. "Düz veriler istiyorsanız CSV'yi kullanın."

Sorun, gerçek dünya verilerinin nadiren tamamen düz olmasıdır. CSV, iç içe geçmiş yapılara, nesnelerin içindeki listelere veya virgül ve tırnak işaretleri içeren karmaşık açıklamalara sahip olduğunuz anda tamamen bozulur.

Karşılaştırmalarda, özellikle Karma Yapı İzleme'de (e-ticaret siparişlerini ve olay günlüklerini içerir), CSV, verileri kayıplı düzleştirme olmadan temsil edemediği için tamamen hariç tutuldu.

TOON bunu incelikle ele alıyor. Dizileri optimize ederken iç içe geçmiş nesnelere izin verir. 100 GitHub deposunun (karışık metin açıklamaları ve meta veriler içeren) testinde verimlilik farkı açıktı:

JSON: 15.145 jeton

TOON: 8.745 jeton (%42,3 tasarruf)

JSON Compact'a (küçültülmüş) karşı bile TOON yaklaşık %24 daha fazla tasarruf elde etti. Milyon jeton başına ödeme yaptığınızda bu anında yatırım getirisidir.

Doğruluk: Sürpriz Kazanan

İşte beni şaşırtan kısım. Genellikle verileri sıkıştırdığınızda netliği kaybedersiniz. LLM'nin daha yoğun bir formatı ayrıştırmakta zorlanmasını beklersiniz. Benchmarklar tam tersini gösteriyor.

Claude Haiku, Gemini Flash ve GPT-5-nano gibi modellerde test edilen 209 veri alma sorusu karşısında TOON, standart JSON'un %69,7 ile karşılaştırıldığında %73,9 alma doğruluğu elde etti.

Neden? Muhtemelen Bilişsel Yük (veya Yüksek Lisans eşdeğeri) ile ilgilidir.

Daha Az Gürültü: Modelin binlerce tekrarlanan "anahtar" jetonuyla ilgilenmesi gerekmez. Dikkat mekanizmasında ilgili değerler birbirine daha yakındır.

Açık Meta Veriler: TOON başlıkları, sayıyı ([N]) ve alan adlarını açıkça içerir.

Yapı Farkındalığı: Veri kümesi yapısını soran testlerde (ör. "Kaç satır var?"), TOON %88 doğruluk elde ederken, JSON ve XML geride kaldı. TOON başlığındaki açık sayım ("depolar[100]`), modelin, LLM'lerin çok kötü olduğu bilinen belirteçleri manuel olarak "saymak" zorunda kalmasını önleyen bir ipucu görevi görür.

XML ve YAML Yorgunluğu

Diğer yarışmacılardan kısaca bahsetmek gerekiyor.

XML burada en çok kaybeden taraf. Ayrıntılıdır, okunması zordur ve işlenmesi pahalıdır. Karşılaştırmalarda XML tutarlı bir şekilde en fazla jetonu kullandı (TOON'un ~2.700'de temsil ettiği tek tip çalışan kayıt seti için 5.000'den fazla) ve en düşük doğruluğa (%67,1) sahipti.

YAML XML'den daha iyi performans gösteriyor ancak TOON'a kıyasla yine de jeton şişkinliği yaşıyor. YAML, insan yapılandırma dosyaları için harika olsa da, boşluklara duyarlı yapısı ve anahtar tekrarı, onu yüksek hacimli veri bağlamı için idealin altında kılıyor. "E-ticaret siparişleri" testinde YAML, TOON'dan ~%14 daha fazla token kullandı.

Ne Zaman Geçiş Yapılmalı?

Veriler oldukça kesindir. Eğer uğraşıyorsanız:

Nesne Listeleri: Günlükler, işlem geçmişleri, arama sonuçları veya ürün katalogları.

RAG İşlem Hatları: Bir istemi beslemek üzere bir veritabanından veri yığınlarını aldığınız yerdir.

Yüksek Hacimli API'ler: Bant genişliği ve gecikmenin önemli olduğu yerler.

TOON "her iki dünyanın da en iyisi" senaryosunu sunuyor. CSV'nin yoğunluğunu JSON'un yapısal bütünlüğüyle elde edersiniz.

Karşılaştırmalarda GPT-5-nano, TOON biçimli verilerde şaşırtıcı bir %90,9 doğruluk elde etti. Bu, daha yeni, daha akıllı modellerin bu optimize edilmiş formatları ayrıştırmada giderek daha usta hale geldiğini, yani JSON'dan uzaklaşmanın "okunabilirlik cezasının" makine için fiilen sıfır olduğu anlamına geliyor.

RAG bağlamınızı hâlâ "JSON.stringify(data, null, 2)" olarak biçimlendiriyorsanız, her bir API çağrısında fiilen bir "okunabilirlik vergisi" ödüyorsunuz demektir. Formatları değiştirmenin zamanı gelmiş olabilir.