वेब पर कब्जा और परिवर्तित करने के लिए उपकरण

उत्पाद सूची और विस्तार पृष्ठ कैसे परिमार्जन करें

वेबसाइटों पर अक्सर एक खोज पृष्ठ होता है, जिसमें आइटमों की एक सूची होती है, प्रत्येक आइटम के साथ एक विवरण पृष्ठ के लिंक के साथ एक सारांश विवरण दिया जाता है जिसमें आइटम पर गहराई से जानकारी शामिल होती है।

जैसा कि यह संरचना इतनी बार उपयोग की जाती है कि अक्सर खोज पृष्ठ से प्रत्येक आइटम के बारे में कुछ जानकारी परिमार्जन करने की आवश्यकता होती है और बाकी विस्तार पृष्ठ से। यह लेख इस तरह की जानकारी को परिमार्जन करने के बारे में मार्गदर्शन देगा।

पहले उस उत्पाद सूची पृष्ठ का URL दर्ज करें जिसे आप परिमार्जन करना चाहते हैं। फिर उत्पाद सूची पृष्ठ से वह जानकारी चुनें जिसे आप चुनना चाहते हैं। सुनिश्चित करें कि डेटा के सभी उदाहरण चयनित हैं।

इसके बाद स्क्रैप निर्देश पेज पर क्लिक करें स्क्रेप निर्देश जोड़ें.

पहली बात यह है कि हमारा स्क्रैपर ठीक उसी तरह से काम करता है जैसे कि ब्राउज़र में अगर कोई कुकी सुरक्षा सूचना या अन्य इनलाइन पॉपअप है जो आपको उस पृष्ठ पर क्लिक करने से रोकता है जिस पेज पर आपको पॉपअप बंद करने से पहले स्क्रैपर को निर्देश देना चाहिए बाकी खुरचन का काम किया जा सकता है। इनमें से अधिकांश पॉपअप को केवल एक बार क्लिक करने की आवश्यकता होती है और इसलिए आप GrabzIt को ऐसा करने के लिए कह सकते हैं। ऐसा करने के लिए उपयोग करें तत्व पर क्लिक करें कार्रवाई और पॉपअप को बंद करने के लिए आवश्यक HTML तत्व पर क्लिक करें। इसके बाद वन्स ओनली ऑप्शन पर क्लिक करें Save और अगला।

अगला चुनें डेटा निकालें कार्रवाई, फिर उस डेटा का चयन करें जिसे आप निकालना चाहते हैं। इसलिए, यदि आप खोज परिणामों की सूची से, किसी आइटम का शीर्षक चुनना चाहते हैं। सुनिश्चित करें कि उस सूची में प्रत्येक शीर्षक चयनित है।

हमारा विज़ार्ड स्वचालित रूप से डेटा के सेट की पहचान करने की कोशिश करता है और आप जितनी चाहें, उससे अधिक जानकारी का चयन कर सकते हैं। यदि ऐसा होता है तो फिर से उन मदों पर क्लिक करें जिन्हें आप नहीं चुनना चाहते हैं और वे अब शामिल नहीं होंगे। यह हमारे वेब स्क्रैपर को सिखाता है कि क्या निकालना है।

अब, उस डेटा आइटम की विशेषता चुनें, जिसे आप निकालना चाहते हैं। जैसे कि "पाठ" और फिर अगला क्लिक करें। अगली स्क्रीन पर इसे एक शीर्षक दें। ध्यान दें कि यहां आप सभी डेटा को डिफ़ॉल्ट टेम्पलेट का उपयोग करना चाहते हैं। ऐसा इसलिए है क्योंकि आप चाहते हैं कि डेटा तब निकाला जाए जब वह किसी विशेष टेम्पलेट पर न हो।

एक बार जब आप उत्पाद खोज पृष्ठ से निकालने के लिए इच्छित सभी आइटम डेटा का चयन कर लेते हैं। उत्पाद विवरण पृष्ठ पर अधिक जानकारी के लिए सभी लिंक का चयन करें। यह उदाहरण के लिए चित्र हो सकता है। फिर क्लिक करें तत्व पर क्लिक करें कार्रवाई। टेम्पलेट को "विस्तार" पर सेट करें और फिर इसे पांच सेकंड की देरी दें और अगला क्लिक करें। जब यह पूछता है कि क्या आप नए पृष्ठ से डेटा निकालना चाहते हैं तो हाँ चुनें। अब उस डेटा को चुनें जिसे आप पहले की तरह निकालना चाहते हैं। लेकिन इस बार, निर्दिष्ट करें कि इसे "विवरण" टेम्पलेट के तहत निष्पादित किया जाना चाहिए।

एक और परिमार्जन निर्देश जोड़ें और मुख्य पृष्ठ पर वापस जाएँ। इस बार पृष्ठ के लिंक से अगला बटन चुनें। जब क्रिया पर क्लिक करें विकल्प बॉक्स प्रकट होता है कृपया का चयन करें अगला पेज बटन विकल्प। इस तरह से स्क्रैपर जानता है कि यह बटन वास्तव में एक पेजिनेशन बटन है और सभी परिणामों के माध्यम से पेजेट करेगा। कृपया सुनिश्चित करें कि आपके पास यह स्क्रैप अनुदेश अंतिम है। यदि यह अंतिम परिमार्जन निर्देश नहीं है, तो इसे अंत तक खींचा जा सकता है।

फिर शेड्यूल टैब पर जाएं और स्क्रैच शुरू करने के लिए Create पर क्लिक करें। आप पंक्ति चिह्न पर क्लिक करके और फिर परिमार्जन के दर्शक आइकन पर क्लिक करके प्रबंधित स्क्रैप पेज पर वास्तविक समय में स्क्रैप की प्रगति देख सकते हैं।