वेब पर कब्जा और परिवर्तित करने के लिए उपकरण

डेटा निकालें और इसे रूपांतरित करें intओए डेटासेट

सबसे आम आवश्यकताओं में से एक वेबसाइट से डेटा निकालना और इसे चालू करना है intOa सारणीबद्ध संरचना जिसे आगे की प्रक्रिया के लिए निर्यात किया जा सकता है। लेकिन अभी एक डेटासेट क्या है और इसका उपयोग कैसे किया जाता है GrabzIt के वेब खुरचनी?

उदाहरण डेटासेट: मूल्य सूची

नीचे डेटासेट में निहित तालिका डेटा है मूल्य सूची, तालिका में तीन कॉलम होते हैं आइटम लेबल, वस्तु वर्णन और सामान की क़ीमत.

आइटम लेबल वस्तु वर्णन सामान की क़ीमत
कैमरा डिजिटल फोटो लेता है $99.00

इस डेटासेट को बनाने के लिए आपको निम्नलिखित परिमार्जन निर्देशों का उपयोग करना होगा।

Data.save('Camera', 'price list', 'item label');
Data.save('Takes digital photos', 'price list', 'item description');
Data.save('$99.00', 'price list', 'item price');

इस का उपयोग करता है Data.save a जोड़ने की विधि डेटा का मान किसी विशेष के लिए डाटासेट और स्तंभ। हर समय Data.save विधि समान डेटासेट और स्तंभ नाम मापदंडों के साथ कहा जाता है, उस स्तंभ में एक नई पंक्ति जोड़ी जाती है। हालाँकि उपर्युक्त परिमार्जन निर्देश बहुत उपयोगी नहीं हैं क्योंकि हम स्थैतिक मूल्यों का उपयोग करके डेटासेट बना रहे हैं। नीचे दिया गया कोड एक वेबपेज का HTML दिखाता है, हम तब पेज से डेटा को गतिशील रूप से निकालने के लिए परिमार्जन निर्देश लिखेंगे save it intओए डेटासेट।

<html>
    <body>
        <span id="spnLabel">Nikon 1055</span>
        <span id="spnDescription">Great little camera, creates clear sharp images.</span>
        <span id="spnPrice">$99.99</span>
    </body>
</html>

अब हम उपयोग करेंगे Page.getTagValue स्पैन टैग से मान निकालने की विधि।

Data.save(Page.getTagValue({"id":{"equals":"spnLabel"}}), 'price list', 'item label');
Data.save(Page.getTagValue({"id":{"equals":"spnDescription"}}), 'price list', 'item description');
Data.save(Page.getTagValue({"id":{"equals":"spnPrice"}}), 'price list', 'item price');

जैसा कि आप देख सकते हैं Page.getTagValue विधियाँ एक फ़िल्टर का उपयोग करती हैं, जो उस HTML तत्व को विशिष्ट रूप से पहचानती है जिसे पाठ से निकालने की आवश्यकता है। इस स्थिति में फ़िल्टर निर्दिष्ट कर रहे हैं कि आईडी HTML विशेषता बराबर होनी चाहिए spnLabel, spnDescription or spnPrice क्रमशः। पर क्लिक करके आप आसानी से एक फिल्टर जेनरेट कर सकते हैं फ़िल्टर बटन आइकन, जो फ़िल्टर के निर्माण को सरल बनाने के लिए एक विज़ार्ड प्रदर्शित करता है।

एक बार जब आप अपना डेटासेट बना लेते हैं जैसा कि हमने यहां दिखाया है, तो आप यह तय कर सकते हैं कि आप इसे कैसे निर्यात करना चाहते हैं निर्यात विकल्प टैब.