कभी जो एक डाटासेट का निर्माण में वेब खुरचनी अधिक मूल्य जोड़े जाते हैं into एक कॉलम दूसरे की तुलना में। पहले पृष्ठ को स्क्रैप करने के बाद नीचे दिए गए उदाहरण में नाम को तीन रंगों के साथ नाम स्तंभ में जोड़ा गया है और अगले पृष्ठ पर डेविड का नाम एक और दो रंगों के साथ जोड़ा गया है। निम्नलिखित डेटासेट देने के लिए।
नाम | रंग |
---|---|
जॉन | पीला |
डेविड | लाल |
हरा | |
नीला | |
बैंगनी |
हालाँकि यह तालिका भ्रामक है क्योंकि यह नहीं दिखाती है कि कौन सा नाम किन रंगों के साथ मिला है। इसके बजाय pad
विधि का उपयोग स्वचालित रूप से रिक्त कक्षों को स्वचालित रूप से डेटासेट कॉलम के अंत में जोड़ने के लिए किया जा सकता है जब तक कि सभी कॉलम समान लंबाई के न हों। का एक उदाहरण pad
उपयोग की जा रही विधि नीचे दी गई है।
Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color'); Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color'); Data.pad();
ये परिमार्जन निर्देश एक डेटासेट का उत्पादन करते हैं जो इस तरह दिखता है।
नाम | रंग |
---|---|
जॉन | पीला |
लाल | |
हरा | |
डेविड | नीला |
बैंगनी |
हम इसे और बेहतर कर सकते हैं padValue
का पैरामीटर pad
स्क्रैपर द्वारा पाया जाने वाला नाम होने की विधि। जैसा कि इस उदाहरण में प्रति पृष्ठ केवल एक नाम है जो परिमार्जन निर्देश बन जाता है।
var name = Page.getTagValue({"class":{"equals":"Name"}}); Data.save(name, 'Name', 'Color'); Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color'); Data.pad(name);
जो नाम स्तंभ के प्रत्येक खाली कक्ष में एक नाम रखता है जैसा कि नीचे दिखाया गया है।
नाम | रंग |
---|---|
जॉन | पीला |
जॉन | लाल |
जॉन | हरा |
डेविड | नीला |
डेविड | बैंगनी |