सेमल्ट: Google ज्ञान ग्राफ और यह कैसे काम करता है को समझना



Google को आपकी वेब सामग्री की समझ को सुविधाजनक बनाने के लिए, यह महत्वपूर्ण है कि हम समझें कि ज्ञान ग्राफ में विषयों को कैसे प्रभावित किया जाए। सेमलेट एक वेबसाइट है जो अपने ग्राहकों के लिए सर्वोत्तम सेवाएं प्रदान करने के लिए समर्पित है, जिसका अर्थ है कि सब कुछ एसईओ से संबंधित है। एक कंपनी के रूप में जो वेब डिज़ाइन और वेब विकास दोनों पर ध्यान केंद्रित करती है, हम एक वेबसाइट के प्रत्येक पहलू में SEO को शामिल करते हैं। यह, निश्चित रूप से, Google ज्ञान रेखांकन की समझ शामिल है।

ज्ञान रेखांकन क्या खास बनाता है?

ज्ञान ग्राफ के बिना, एक खोज इंजन, विशेष रूप से Google के लिए, संस्थाओं के लिए संरचित डेटा का उपयोग करना मुश्किल होगा। मार्कअप और अर्थ डेटा, बदले में, विचारों और अवधारणाओं को जोड़ने में मदद करते हैं, जिससे उन्हें संरचित डेटा में बदलना आसान हो जाता है जिसका उपयोग हम Google के ज्ञान ग्राफ को भरने या प्रभावित करने के लिए कर सकते हैं।

एसईओ पेशेवरों के रूप में, यह हमारा कर्तव्य है कि हम उन तरीकों को समझें, जिन्हें हम ग्राफ में इन विषयों को प्रभावित कर सकते हैं, इसलिए हम Google की उनकी सामग्री की समझ में सार्थक बदलावों को प्रभावित कर सकते हैं।

एसईओ पेशेवरों के रूप में, हम समझते हैं कि Google में हमारे ग्राहक की सामग्री की समझ में सार्थक बदलावों को प्रभावित करने के लिए विषयों को कैसे प्रभावित किया जाए।

Google ज्ञान ग्राफ़ क्या है?

हम एक डेटाबेस और एक विश्वकोश के बीच ज्ञान ग्राफ को एक चौराहा मानते हैं। डेवलपर्स प्रत्येक आलेख को Google के ग्राहक-सामना वाले लेखों में एक एंटिटी द्वारा या एक विषय के रूप में ज्ञान ग्राफ में संदर्भित करते हैं।

एक इकाई बिल्कुल कुछ भी हो सकती है। अधिकांश डेटाबेसों की तरह, इसका एक विशिष्ट पहचानकर्ता है, जिसे आप कभी-कभी Google के URL में देखते हैं। यह इस तरह दिखता है: [kgmid=/ g/11f0vfyswk & hl], पैरामीटर नाम "kgmid", हालांकि, इकाई प्रकार के आधार पर बदल सकता है।

आमतौर पर, एक इकाई के बारे में कई कथन होते हैं:
  • एक शीर्षक या नाम (जैसे "जॉर्ज बुश")।
  • प्रकार या प्रकार (जैसे "व्यक्ति")।
  • एक विवरण (जैसे "एक बार संयुक्त राज्य अमेरिका के राष्ट्रपति थे")।
  • छवि URL की एक सूची (आमतौर पर उपयोग अधिकारों से जुड़ी)।
  • एक विस्तृत विवरण (स्रोत के URL के साथ कुछ व्याख्यात्मक पाठ)।
हालाँकि, Google कहता है कि जबकि ऊपर की सूची में जानकारी सीधे उनके खोज एपीआई में उपलब्ध हो सकती है, यह डेटा आंतरिक रूप से काफी संवर्धित है।

इसलिए ऊपर दिए गए उदाहरण में, डेटा में वह तिथि भी शामिल हो सकती है, जब बुश का जन्म हुआ था और उनकी मृत्यु हो गई थी; इसमें शामिल हो सकता है कि उसकी शादी बारबरा बुश से हुई थी। यह कार्यालय में उनकी कुछ उपलब्धियों और इतने पर उल्लेख कर सकता है।

प्रदान की गई सभी जानकारी के साथ, यह देखना आसान हो जाता है कि एक विश्वकोश लेख की तुलना में कितना अंतर नहीं है। हालांकि, अंतर यह है कि क्योंकि सभी तथ्यों को "कार्यालय में वर्षों की संख्या" जैसे क्षेत्रों में वर्गीकृत किया जाता है, मशीनों को विषयों के बीच डॉट्स को कनेक्ट करना आसान लगता है। जब कोई व्यक्ति अनुरोध करता है तो मशीनें तुरंत सही जानकारी प्राप्त करना आसान बनाती हैं। उदाहरण के लिए, यदि आप खोजते हैं कि जॉर्ज बुश से किसका विवाह हुआ था? आपको यह देखना चाहिए:


असहमति

दुनिया भर में कई ज्ञान ग्राफ हैं, और Google का ज्ञान ग्राफ इन कई ग्राफ़ों में से एक है। अन्य ज्ञान रेखांकन में विकिडाटा.ऑर्ग, dbpedia.com और बहुत कुछ शामिल हैं। दरअसल, अर्ध-संरचित डेटा के किसी भी रूप को एक ज्ञान ग्राफ के रूप में वर्णित किया जा सकता है यही कारण है कि IMDB या विश्वकोश जैसे डेटाबेस को ज्ञान ग्राफ़ के रूप में संदर्भित किया जाता है।

प्रारंभ में, Google ने CIA Factbook और Wikipedia सहित अन्य डेटा सेटों से अपना ज्ञान ग्राफ बनाया। हमने यह भी अफवाहें सुनी हैं कि Google का ज्ञान पैनल इसके ज्ञान ग्राफ के रूप में भी कार्य कर सकता है। यह हालांकि गलत है और इसकी अवहेलना की जानी चाहिए। जबकि ज्ञान पैनल कभी-कभी ग्राफ़ में डेटा का सबसेट का प्रतिनिधित्व करता है, वे एक ही चीज़ नहीं हैं।

ज्ञान पैनल Google के ज्ञान ग्राफ के माध्यम से जुड़े डेटा आइटम के दृश्य प्रतिनिधित्व के रूप में भी कार्य कर सकता है। हालाँकि, Google का ज्ञान ग्राफ विषयों के बारे में एक कम दृश्य रिकॉर्ड है।

अंतिम बिंदु जिसकी हम अवज्ञा करना चाहते हैं वह शब्दावली ही है। आम तौर पर, एक कीवर्ड ज्ञान ग्राफ संस्थाओं या विषयों से बना होता है। स्पष्टता के लिए, हमने देखा है कि Google "विषयों" शब्द का उपयोग करना पसंद करता है, यह देखते हुए कि यह वह शब्द है जो वे अपने सार्वजनिक दस्तावेज में लगातार उपयोग करते हैं।

विषय अधिक उपयोगकर्ता के अनुकूल है, लेकिन यह भी समझना मुश्किल हो जाता है जब Google विषयों या संस्थाओं को संदर्भित करता है।

इकाई विषय प्रकार

आम तौर पर, संस्थाओं को विषय प्रकार दिए जाते हैं। यह एक व्यक्ति हो सकता है; प्रतिस्पर्धा; संगठन, स्थान या देश। यदि इकाई इनमें से कोई नहीं है, तो इसे "थिंग" के रूप में लेबल किया जाता है। उम्मीद है, Google नए प्रवेश प्रकार विकसित करना जारी रखेगा ताकि हम "चीजें" का कम से कम उपयोग करें। Google द्वारा प्रयुक्त प्राकृतिक भाषा प्रसंस्करण एपीआई महत्वपूर्ण सुराग प्रदान करता है जो हमें आश्चर्यचकित करता है कि क्या कई विषय प्रकार वास्तव में उपयोग किए जा रहे हैं। हालाँकि, Google के नॉलेज ग्राफ सर्च एपीआई डेवलपर पेज पर कई अन्य प्रकार के यूनिट पाए जाते हैं। वर्तमान में Google कई संस्थाओं को वर्गीकृत करने में असमर्थ है जैसा कि उसने सूचीबद्ध किया है। हमें उम्मीद है कि जैसे-जैसे समय बीतेगा यह बदल जाएगा।

इसके अलावा, केवल 20% संस्थाओं को प्राकृतिक भाषा प्रसंस्करण एल्गोरिदम द्वारा Google द्वारा उपयोग किए जाने पर उनकी सार्वजनिक पेशकश की तुलना में मान्यता प्राप्त है।

ज्ञान ग्राफ के लाभ

दुनिया की जानकारी को विषयों में व्यवस्थित करने से, वेबपृष्ठों और वेबसाइटों को क्रॉल और अनुक्रमणित करना आसान हो जाता है जो खोज इंजन उत्तोलन करते हैं। इनमें विविधता, पैमाने, अखंडता और गति शामिल हैं।

स्केलिंग के लाभ

इंटरनेट पर वेब पेजों की संख्या एक अत्यधिक बहस का विषय है। हालांकि कुछ लोग यह तर्क दे सकते हैं कि वे अनगिनत हैं, वेब पेजों की संख्या में सबसे अधिक संभावनाएँ खरबों में हैं, और यह संख्या प्रतिदिन विशाल दरों पर बढ़ती रहती है। इसके विपरीत, जिन विषयों को हम मनुष्य समझते हैं, उनकी संख्या काफी कम है, और संख्या बहुत कम दर से बढ़ रही है।

यह इंटरनेट पर मिलने वाली कई सामग्रियों में समान विचारों को साझा करने का एक अनियंत्रित दोहराव दर्शाता है। सेमी-स्ट्रक्चर्ड सिस्टम का उपयोग करके किसी विषय के विवरण को सॉर्ट करके, इंटरनेट पर मौजूद जानकारी एक छोटी सी जगह ले सकती है और उतना दोहराव नहीं होगा।

विभिन्न डेटा स्रोत होने के लाभ

किसी विषय के बारे में जानकारी संग्रहीत करने से, कई डेटा स्रोतों का हवाला देना आसान हो जाता है और आपको उपयोगकर्ताओं को फिर से उसी वेबपेज पर नहीं भेजना पड़ता है। यह हमें बताता है कि Google विषयों के बारे में मुख्य विवरण एकत्र कर सकता है और उन्हें कई अन्य माध्यमों की स्क्रीन या गुच्छा का उपयोग करके प्रदर्शित किया है लेकिन उपयोगकर्ता की क्वेरी या उपयोगकर्ता के लिए बेहतर तरीके से।

सिद्धांत रूप में, किसी विषय की जानकारी कभी-कभी इंटरनेट के बाहर के स्रोतों से प्राप्त की जा सकती है।

सूचना वफ़ादारी लाभ

जबकि Google ज्ञान ग्राफ़ को कभी-कभी त्रुटियों और तथ्यात्मक अशुद्धियों को शामिल करने के लिए जाना जाता है, यह कभी-कभी बुरे अभिनेताओं या एसईओ पेशेवरों द्वारा हेरफेर किया जाता है। हालाँकि, इस दृष्टिकोण से, Google को सत्य का एक बिंदु प्रदान करने का लाभ मिलता है। हालाँकि, विवादास्पद विषयों के लिए ऐसा नहीं हो सकता है।

किसी भी विषय के बारे में एक नया तथ्य Google के ज्ञान ग्राफ में जुड़ने से पहले कई सत्यापन प्रक्रियाओं से गुजरने की आवश्यकता है। लेकिन यह संभावना नहीं है कि Google इन थ्रेसहोल्ड पर खुलकर चर्चा करेगा।

नकारात्मक पक्ष पर, सत्य का एक बिंदु पूर्वाग्रह हो सकता है या जानकारी की विविधता को कम कर सकता है यदि डेटा स्रोत स्वयं पहले से ही मिला हुआ हो।

सूचना पुनर्प्राप्ति लाभ

जानकारी को उनके विषयों के आधार पर छाँटने के लिए धन्यवाद, Google द्वारा और उन उपयोगकर्ताओं द्वारा जानकारी प्राप्त करना बहुत तेज़ हो गया है, जो वेब पेजों के ढेर में जानकारी की सुई खोज रहे होंगे।

Google का नॉलेज ग्राफ कहां उपयोग किया जाता है?

कई एंड्रॉइड और स्मार्टफोन उपयोगकर्ताओं के लिए, ज्ञान का ग्राफ ज्यादातर उनके होम स्क्रीन पर "खोज" सुविधा के लिए उपयोग किया जाता है। Google उपयोगकर्ता के व्यवहार के बारे में जानकारी का उपयोग करता है यह समझने के लिए कि कौन से विषय आपके लिए सबसे महत्वपूर्ण हैं, और वे उपयोगकर्ताओं को उनके उपयोग के इतिहास के आधार पर उन संबंधित विषयों को खोजने में मदद कर सकते हैं।

Google का रुझान एक अन्य स्थान भी है जहां उपयोगकर्ता दिलचस्प विषय पा सकते हैं। उस बिंदु से, Google संकेत दे सकता है कि कौन से विषय एक-दूसरे से निकटता से संबंधित हैं। हालाँकि, वर्तमान साक्ष्यों से पता चलता है कि यह डेटा वर्तमान में उसी उपयोगकर्ता द्वारा अन्य खोजों को खींचकर इकट्ठा किया जाता है, जिससे अप्रत्याशित संबंधित विषय पॉप अप हो सकते हैं।

पैनल के साथ के रूप में, जब कोई उपयोगकर्ता खोज क्वेरी में टाइप करता है जिसे ज्ञान ग्राफ का उपयोग करके उत्तर दिया जा सकता है, तो आपको उच्च-गुणवत्ता वाले खोज परिणाम भी मिलते हैं। अक्सर, ये परिणाम मूल खोज परिणामों को ओवरशेड करते हैं, जो वेबसाइट के लिंक को नीचे की ओर धक्का देते हैं।

ये उत्तर इस तरह भी प्रदर्शित किए जाते हैं कि Google उन उपयोगकर्ताओं के लिए उत्तर प्रदान करने के लिए उपयोग कर सकता है जो ध्वनि खोज का उपयोग करते हैं।

निष्कर्ष

विषय छवि खोजों में अत्यधिक दिखाई देते हैं, इसलिए आप किसी प्रासंगिक स्थान या व्यक्ति की तस्वीर का उपयोग करके खोज से संबंधित जानकारी पा सकते हैं।

यह उन तरीकों का एक उत्कृष्ट उदाहरण है जिसमें ज्ञान के ग्राफ़ को वेबपेजों के अलावा अन्य डेटा स्रोतों के लिए रिपॉजिटरी के रूप में उपयोग किया जाता है।