वेब पर कब्जा और परिवर्तित करने के लिए उपकरण

डेटासेट को कैसे पैड करें

कभी जो एक डाटासेट का निर्माण में वेब खुरचनी अधिक मूल्य जोड़े जाते हैं into एक कॉलम दूसरे की तुलना में। पहले पृष्ठ को स्क्रैप करने के बाद नीचे दिए गए उदाहरण में नाम को तीन रंगों के साथ नाम स्तंभ में जोड़ा गया है और अगले पृष्ठ पर डेविड का नाम एक और दो रंगों के साथ जोड़ा गया है। निम्नलिखित डेटासेट देने के लिए।

नामरंग
जॉनपीला
डेविडलाल
हरा
नीला
बैंगनी

हालाँकि यह तालिका भ्रामक है क्योंकि यह नहीं दिखाती है कि कौन सा नाम किन रंगों के साथ मिला है। इसके बजाय pad विधि का उपयोग स्वचालित रूप से रिक्त कक्षों को स्वचालित रूप से डेटासेट कॉलम के अंत में जोड़ने के लिए किया जा सकता है जब तक कि सभी कॉलम समान लंबाई के न हों। का एक उदाहरण pad उपयोग की जा रही विधि नीचे दी गई है।

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

ये परिमार्जन निर्देश एक डेटासेट का उत्पादन करते हैं जो इस तरह दिखता है।

नामरंग
जॉनपीला
लाल
हरा
डेविडनीला
बैंगनी

हम इसे और बेहतर कर सकते हैं padValue का पैरामीटर pad स्क्रैपर द्वारा पाया जाने वाला नाम होने की विधि। जैसा कि इस उदाहरण में प्रति पृष्ठ केवल एक नाम है जो परिमार्जन निर्देश बन जाता है।

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

जो नाम स्तंभ के प्रत्येक खाली कक्ष में एक नाम रखता है जैसा कि नीचे दिखाया गया है।

नामरंग
जॉनपीला
जॉनलाल
जॉनहरा
डेविडनीला
डेविडबैंगनी