वेब पर कब्जा और परिवर्तित करने के लिए उपकरण

एक वेबसाइट से लिंक निकालें

यह उदाहरण एक के रूप में भी उपलब्ध है टेम्पलेट.

एक सामान्य कार्य वेबसाइट से लिंक निकालना है, विशेष रूप से HTML लिंक। सौभाग्य से उपयोग करते समय यह आसान है GrabzIt के वेब खुरचनी। सबसे पहले सामान्य विवरण के साथ एक नया परिमार्जन बनाएं जैसे कि परिमार्जन का प्रारंभिक पृष्ठ और कोई अन्य विकल्प।

फिर जाओ परिमार्जन निर्देश टैब पर क्लिक करें और क्लिक करें वेब पेज बटन बटन। यह दर्ज करेगा Page कीवर्ड intओ स्क्रैप निर्देश और एक ड्रॉप डाउन को खोलेगा। चुनते हैं getTagAttributes सूची से। अगला जोड़ 'href' पहले पैरामीटर के रूप में, यह वेब स्क्रैपर को href विशेषता निकालने के लिए कहता है, फिर एक अल्पविराम टाइप करें।

इसके बाद क्लिक करें फ़िल्टर बटन इससे आप वेब स्क्रैपर को बता सकते हैं कि href विशेषता को निकालने के लिए कौन से तत्व हैं। फ़िल्टर विंडो में सुनिश्चित करें कि टाइप 'वेब पेज' पर सेट है और प्रतिबंध 'टैग नाम' और 'बराबर' है। फिर दर्ज करें a टेक्स्ट बॉक्स में और फिर Add बटन पर क्लिक करें और फिर फ़िल्टर बटन डालें। पंक्ति के अंत में एक अर्ध-बृहदान्त्र जोड़कर निर्देश समाप्त करें।

आपको कुछ इस तरह से छोड़ना चाहिए जैसे कि नीचे दिखाया गया है।

Page.getTagAttributes('href', {"tag":{"equals":"a"}});

उपरोक्त कोड वेब पेज से सभी लिंक URL को निकालेगा, लेकिन हमें अब इसकी आवश्यकता है save वे लिंक URL के हैं। ऐसा करने के लिए हम इस कमांड को अर्ध-बृहदान्त्र में लपेटेंगे Data.save आदेश। ऐसा करने के लिए लाइन की भीख माँगने के लिए जाएँ और चुनें डेटा बटन बटन। फिर ड्रॉप डाउन सलेक्ट में save, फिर लाइन के अंत में जाएं और एक अल्पविराम जोड़ें। फिर जो आप डेटासेट को 'मेरी वेबसाइट' के रूप में कॉल करना चाहते हैं उसे जोड़ें, फिर एक और अल्पविराम जोड़ें और फिर कॉलम का वर्णन करने के लिए एक और पैरामीटर जोड़ें जैसे कि 'लिंक' फिर एक के साथ कमांड को बंद करें ) अर्ध-उपनिवेश से पहले।

अब आपके पास निम्नलिखित स्क्रैप निर्देश होने चाहिए।

Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');

अब यदि आप स्क्रैप चलाते हैं तो आप वेबसाइट से सभी लिंक निकालेंगे। यह माई वेबसाइट्स के नाम के साथ एक टेबल बनाएगा, जिसमें लिंक के कॉलम नाम के साथ जिसे फिर एक्सपोर्ट किया जा सकता है intXML, CSV या स्प्रेडशीट जैसे कई अलग-अलग प्रारूप। यह ट्यूटोरियल स्क्रेप निर्देश टूलबार में विज़ार्ड बटन का उपयोग करके भी प्राप्त किया जा सकता था।