सिमेंटिक सर्च
कोई दस्तावेज़ पेस्ट करें और सरल भाषा में प्रश्न पूछें — टूल वे पैराग्राफ़ ढूँढता है जो अर्थ में मेल खाते हैं, केवल कीवर्ड में नहीं। एक छोटा एम्बेडिंग मॉडल पूरी तरह आपके ब्राउज़र में चलता है।
आपका डेटा कभी आपके डिवाइस से बाहर नहीं जाताअक्सर पूछे जाने वाले सवाल
-
यह Ctrl+F से कैसे अलग है?
Ctrl+F सटीक शब्दों या सब-स्ट्रिंग से मिलान करता है। सिमेंटिक सर्च अर्थ से मिलान करता है। अगर आप पूछें "डेडलाइन क्या है?" तो यह "हमें शुक्रवार तक डिलीवर करना है" वाला पैराग्राफ सामने ला सकता है, भले ही "डेडलाइन" शब्द कहीं न आया हो।
-
कौन सा मॉडल उपयोग होता है?
MiniLM (Xenova/all-MiniLM-L6-v2), 22 MB का वाक्य-एम्बेडिंग मॉडल। हर पैराग्राफ और आपकी क्वेरी को 384-आयामी वेक्टर में बदला जाता है; टूल कोसाइन समानता से पैराग्राफ़ों को रैंक करता है। सब कुछ @huggingface/transformers के माध्यम से ब्राउज़र में चलता है।
-
क्या मेरा दस्तावेज़ कहीं अपलोड होता है?
नहीं। मॉडल और सारी गणनाएँ आपके ब्राउज़र में ही रहती हैं। टेक्स्ट आपके डिवाइस से बाहर नहीं जाता।
-
किस प्रकार के दस्तावेज़ सबसे अच्छा काम करते हैं?
वह सब कुछ जिसे आप कॉपी-पेस्ट कर सकते हैं — मीटिंग ट्रांसक्रिप्ट, नीति दस्तावेज़, लेख, चैट लॉग, मैनुअल के अंश। अधिक सटीक मिलान के लिए लंबे कंटेंट को छोटे पैराग्राफ़ों (उनके बीच खाली पंक्ति) में बाँटें।