ایل ایل ایم ایس کے ساتھ ٹون کا استعمال کیسے کریں

ایل ایل ایم
فوری انجینئرنگ

اگر آپ نے کبھی چیٹ یا کلاڈ میں JSON کی ایک بڑی صف کو چسپاں کیا ہے تو ، آپ نے ممکنہ طور پر سیاق و سباق کی کھڑکی کے بند ہونے کا درد محسوس کیا ہوگا۔ JSON ویب APIs کے لئے لاجواب ہے ، لیکن بڑی زبان کے ماڈل (LLMs) کے لئے ، یہ حیرت انگیز طور پر بیکار ہے۔ " ID ": ، " نام ": ، ، اور "ٹائم اسٹیمپ" جیسے فیلڈ کے ناموں کو دہرانا: ہر ایک ریکارڈ کے لئے صرف بے کار نہیں ہے۔ یہ ٹوکن کے ذریعے جلتا ہے جس کی قیمت حقیقی رقم اور قیمتی سیاق و سباق کی جگہ ہوتی ہے۔

یہ وہ جگہ ہے جہاں ٹون (ٹیبل آبجیکٹ نوٹیشن) چمکتا ہے۔ یہ صرف ڈیٹا کی شکل نہیں ہے۔ یہ ایل ایل ایم تعامل کو بہتر بنانے کی حکمت عملی ہے۔ JSON کے نحو ٹیکس کو ختم کرکے اور واضح ڈھانچے کے ہیڈروں کو شامل کرکے ، ٹون آپ کو اپنے ماڈلز میں مزید ڈیٹا منتقل کرنے اور بدلے میں زیادہ قابل اعتماد ساختی آؤٹ پٹ حاصل کرنے کی اجازت دیتا ہے۔

ٹون کی ٹوکن اکنامکس

تبدیل شدہ فارمیٹس کو کیوں پریشان کریں؟ ریاضی آسان ہے۔ اشیاء کی ایک معیاری JSON صف میں ، اسکیما ہر صف کے لئے دہرایا جاتا ہے۔ اگر آپ کے پاس 50 صارفین کی فہرست ہے تو ، آپ 50 بار فیلڈ کے ناموں کی ادائیگی کر رہے ہیں۔

ٹون نے ایک بار ہیڈر میں اسکیما کا اعلان کرکے اس فالتو پن کو ختم کردیا۔ اعداد و شمار ایک گھنے ، ندی سے جڑے ہوئے فارمیٹ میں ہیں۔ عملی طور پر ، اس کے نتیجے میں عام طور پر فارمیٹڈ JSON کے مقابلے میں یکساں صفوں کے لئے ٹوکن کے استعمال میں ** 30-60 ٪ کمی ** ہوتی ہے۔ جب آپ بڑے پیمانے پر سیاق و سباق کی کھڑکیوں یا اعلی حجم API کالوں سے نمٹ رہے ہیں تو ، اس کارکردگی کا براہ راست ترجمہ کم بلوں اور کم تاخیر سے ہوتا ہے۔

ڈیٹا بھیجنا: "دکھائیں ، نہ بتائیں" قاعدہ

جب آپ کو ڈیٹا کا تجزیہ کرنے کے لئے ایل ایل ایم کی ضرورت ہو تو ، آپ کی فوری حکمت عملی بہت ضروری ہے۔ ابتدائی اعداد و شمار کی شکل کی وضاحت کرتے ہوئے اکثر لمبے پیراگراف لکھتے ہیں۔ ٹون کے ساتھ ، آپ کو ایسا کرنے کی ضرورت نہیں ہے۔

ایل ایل ایم پیٹرن سے ملنے والے انجن ہیں۔ وہ ٹون کو بدیہی طور پر سمجھتے ہیں کیونکہ یہ یامل اور سی ایس وی کے ہائبرڈ کی طرح لگتا ہے - فارمیٹ جو انہوں نے تربیت کے دوران اربوں بار دیکھا ہے۔

ڈیٹا بھیجنے کے لئے ، اسے صرف باڑ والے کوڈ بلاک میں لپیٹیں۔ آپ اسے ٹون پر لیبل لگا سکتے ہیں ، لیکن یہاں تک کہ اگر ماڈل کا نحو ہائی لائٹر باضابطہ طور پر اس کی حمایت نہیں کرتا ہے تو ، ماڈل فوری طور پر اس ڈھانچے کو سمجھتا ہے۔

ان پٹ مثال

اسکیما کو بیان کرنے کے بجائے ، صرف بلاک فراہم کریں:

ہیڈر `صارفین [3] {ID ، نام ، کردار ، لسٹلوگین} model ماڈل کو ہر وہ چیز بتاتا ہے جس کو اسے جاننے کی ضرورت ہے: ہستی کی قسم ، گنتی (3 قطار) ، اور کھیتوں کا حکم۔ انڈینٹیشن درجہ بندی کو سنبھالتا ہے۔ یہ "خود دستاویزی" فطرت نحو کی تجزیہ کرنے کی ہدایات کے بجائے اصل منطق کے کام پر توجہ مرکوز کرنے کے لئے آپ کے اشارے کو آزاد کرتی ہے۔

`` `MD یہاں صارف کی سرگرمی لاگ ہے۔ ڈیٹا ٹون فارمیٹ (2 اسپیس انڈینٹ ، واضح ہیڈر) میں ہے۔

صارفین [3] {ID ، نام ، کردار ، لسٹلوگن}: 1 ، ایلس ، ایڈمن ، 2025-01-15T10: 30: 00Z 2 ، باب ، صارف ، 2025-01-14T15: 22: 00Z 3 ، چارلی ، صارف ، 2025-01-13T09: 45: 00Z

ٹاسک: نوشتہ جات کا تجزیہ کریں اور شناخت کریں کہ کون سے صارفین نے پچھلے 24 گھنٹوں کے اندر لاگ ان نہیں کیا ہے۔ `` `

قابل اعتماد آؤٹ پٹ تیار کرنا

_ ریڈ_ ڈیٹا پر ایل ایل ایم حاصل کرنا آسان ہے۔ اسے _ جینریٹ_ درست ڈھانچے والے اعداد و شمار پر حاصل کرنا مشکل حصہ ہے۔ ماڈلز کو فریب کرنا ، JSON کو چھوٹا کرنا ، یا بند ہونے والے منحنی خطوط وحدانی کو بھول جانا پسند ہے۔

ٹون نے اپنے ہیڈر نحو کے ذریعہ حفاظت کی ایک پرت شامل کی ، خاص طور پر [n] گنتی۔ جب آپ کسی ماڈل کو ٹون کو آؤٹ پٹ کرنے کے لئے کہتے ہیں تو ، آپ اعداد و شمار کو تیار کرنے سے پہلے کسی ڈھانچے کا ارتکاب کرنے کے لئے کہہ رہے ہیں۔

نسل کے لئے اشارہ کرنا

بہترین نتائج حاصل کرنے کے لئے ، آپ کی توقع ہیڈر فارمیٹ فراہم کریں اور ماڈل کو قطاریں بھرنے کی ہدایت کریں۔

ماڈل کو [n] کا حساب لگانے کے لئے کہہ کر ، آپ "سوچ کی زنجیر" کے عمل پر مجبور کرتے ہیں جہاں ماڈل کو آؤٹ پٹ سائز کی منصوبہ بندی کرنی ہوگی۔ یہ بظاہر چھوٹی سی رکاوٹ ماڈل کے آدھے راستے میں کٹ جانے کے امکانات کو نمایاں طور پر کم کرتی ہے۔

`` `MD ٹاسک: "صارف" کے کردار کے ساتھ فعال صارفین کی فہرست واپس کریں۔ فارمیٹ: ٹون کا استعمال کریں۔ آپ تیار کردہ قطاروں کی صحیح تعداد سے ملنے کے لئے ہیڈر میں [n] ویلیو مقرر کریں۔

متوقع شکل: صارفین [n] {ID ، نام ، کردار ، لسٹلوگن}: `` `

سخت وضع کے ساتھ توثیق کرنا

جب آپ کو ایل ایل ایم کا جواب موصول ہوتا ہے تو ، آپ کو صرف اس پر اعتماد نہیں کرنا چاہئے۔ یہ وہ جگہ ہے جہاں ٹون لائبریری کا سخت موڈ پروڈکشن ایپلی کیشنز کے لئے ایک سپر پاور بن جاتا ہے۔

اگر آپ ٹائپ اسکرپٹ لائبریری کا استعمال کررہے ہیں تو ، سخت موڈ کے ساتھ ضابطہ کشائی کرنے سے یہ توثیق ہوتی ہے کہ پیدا شدہ قطار ہیڈر کی گنتی سے ملتی ہے:

اس سے آپ کو اپنی درخواست میں خراب ڈیٹا کو بہاو دریافت کرنے کے بجائے فوری طور پر "سست" ماڈل آؤٹ پٹس یا نیٹ ورک کی تراشوں کو پروگرام کے مطابق پکڑنے کی سہولت ملتی ہے۔

`` `ٹائپ اسکرپٹ '@ٹون-فارمیٹ/ٹون' سے {ڈیکوڈ} درآمد کریں ؛

کوشش کریں { // اگر ماڈل کہتا ہے [5] لیکن 4 قطاریں مہیا کرتا ہے تو ، اس سے ایک غلطی ہوتی ہے۔ کانس ڈیٹا = ڈیکوڈ (ماڈل آؤٹ پٹ ، {سخت: سچ}) ؛ کنسول.لاگ ('درست ڈیٹا موصول ہوا:' ، ڈیٹا) ؛ } کیچ (غلطی) { کنسول۔ ایرر ('ماڈل ہالوچینیشن یا تراشنے کا پتہ چلا:' ، غلطی۔ میسج) ؛ دہ `` `

اعلی درجے کی اصلاح: ٹیب ٹرک

اگر آپ کو اصلاح کا جنون ہے (اور ایل ایل ایم کی دنیا میں ، آپ کو شاید ہونا چاہئے) ، تو آپ اپنے حد بندیوں کو دانشمندی سے منتخب کرکے اور بھی زیادہ کارکردگی کو نچوڑ سکتے ہیں۔

کوما معیاری ہیں ، لیکن ٹیبز (\ t) کو اکثر ٹوکنائزر کے بہت سے الفاظ میں ایک ہی ٹوکن کے طور پر پیش کیا جاتا ہے۔ مزید برآں ، ٹیبز قدرتی متن کے شعبوں کے اندر شاذ و نادر ہی ظاہر ہوتے ہیں ، جو فرار کے کرداروں کی ضرورت کو کم کرتے ہیں (جیسے قیمتوں میں تار کو لپیٹتے ہیں)۔

ماڈل کو بھیجنے سے پہلے آپ اپنے ڈیٹا کا استعمال کرتے ہوئے اپنے ڈیٹا کو انکوڈ کرسکتے ہیں:

صرف پرامپٹ میں ماڈل کو مطلع کرنا یاد رکھیں: _ "ڈیٹا ٹیب سے الگ ٹون ہے۔" _ اس سے ایک ہائپر کمپیکٹ نمائندگی پیدا ہوتی ہے جو ماڈل کو پارس اور پیدا کرنا ناقابل یقین حد تک آسان ہے۔

`ٹائپ اسکرپٹ const toonprompt = انکوڈ (ڈیٹا ، {ڈیمیٹر: '\ t'}) ؛ `

ایک مکمل ورک فلو مثال

آئیے ایک حقیقی دنیا کے منظر نامے پر نظر ڈالتے ہیں: فلٹرنگ سسٹم لاگز۔ آپ ماڈل کو کچے لاگ بھیجنا چاہتے ہیں اور غلطیوں کی تشکیل شدہ فہرست حاصل کرنا چاہتے ہیں۔

** اشارہ: **

** ماڈل آؤٹ پٹ: **

`` `MD ٹون فارمیٹ میں سسٹم لاگ (ٹیب سے الگ):

واقعات [4] {ID ، سطح ، پیغام ، ٹائم اسٹیمپ}: 1 ، غلطی ، کنکشن ٹائم آؤٹ ، 2025-01-15T10: 00: 00Z 2 ، انتباہ ، سست سوال ، 2025-01-15T10: 05: 00Z 3 ، معلومات ، صارف لاگ ان ، 2025-01-15T10: 10: 00Z 4 ، غلطی ، ڈیٹا بیس کی خرابی 025-01-15T10: 15: 00Z

ٹاسک: تمام واقعات کو 'غلطی' کی سطح کے ساتھ نکالیں۔ ایک تازہ ترین ہیڈر گنتی کے ساتھ درست ٹون کے طور پر نتیجہ واپس کریں۔ `` `

** نتیجہ: **

`ٹون واقعات [2] {ID ، سطح ، پیغام ، ٹائم اسٹیمپ}: 1 ، غلطی ، کنکشن ٹائم آؤٹ ، 2025-01-15T10: 00: 00Z 4 ، غلطی ، ڈیٹا بیس کی خرابی ، 2025-01-15T10: 15: 00Z `

ماڈل نے فہرست کو صحیح طریقے سے فلٹر کیا اور ، اہم طور پر ، ہیڈر کو واقعات [2] میں اپ ڈیٹ کیا۔ اس جواب کو ضابطہ کشائی کرکے ، آپ کو اپنی درخواست کی منطق کے لئے صاف ، ٹائپ سیف سرنی تیار ملتی ہے۔

خلاصہ

ٹون انسانی پڑھنے کی اہلیت اور مشین کی کارکردگی کے مابین فرق کو پلاتا ہے۔ یہ ایل ایل ایم کی لاگت کی رکاوٹوں کا احترام کرتا ہے جبکہ مضبوط سافٹ ویئر ڈویلپمنٹ کے لئے درکار ڈھانچے کو فراہم کرتے ہیں۔

  1. ** اسے چھوٹا رکھیں: ** اپنی مثالوں میں 2-5 قطاریں استعمال کریں۔ ماڈل عام ہوجائے گا۔
  1. ** واضح ہو: ** ہیڈروں کی واضح وضاحت کریں تاکہ ماڈل اسکیما کو جانتا ہو۔
  1. ** سختی سے توثیق کریں: ** نسل کی غلطیوں کو پکڑنے کے لئے فارمیٹ کا میٹا ڈیٹا استعمال کریں۔

اپنے فوری پے لوڈ کے ل J JSON سے دور ہوکر ، آپ صرف ٹوکن کی بچت نہیں کررہے ہیں - آپ زیادہ قابل اعتماد AI پائپ لائن بنا رہے ہیں۔