GrabzIt के वेब खुरचनी एक वेबसाइट से ईमेल पते निकालने में आसान बनाने के लिए कई विशेष उपयोगिता विधियां प्रदान करता है। नीचे दिए गए उदाहरण में एक वेब पेज से सभी HTML सामग्री मिलती है और फिर इसे पास किया जाता है Utility.Text.extractAddresses
पतों को सहेजने से पहले सभी वैध ईमेल पते खोजने की विधि intoa डाटासेट, जो तब उपयोगकर्ता को भेजा जाता है।
वैकल्पिक रूप से सिर्फ पहले मिलान वाले ईमेल पते का उपयोग करके निकाला जा सकता है Utility.Text.extractAddress
विधि.
Data.save(Utility.Text.extractAddresses(Page.getHtml()));
पीडीएफ दस्तावेजों को भी स्क्रैप किया जा सकता है ईमेल पते के लिए इसी तरह से वेब पेज कैसे ऊपर स्क्रैप किए जाते हैं। जैसा कि आप नीचे दिए गए उदाहरण में देख सकते हैं कि प्रक्रिया बिल्कुल वैसी ही है सिवाय इसके कि PDF.getText()
के बजाय विधि का उपयोग किया जाता है Page.getHtml()
विधि.
Data.save(Utility.Text.extractAddresses(PDF.getText()));
GrabzIt करने की क्षमता है छवियों से पाठ निकालें इसका मतलब है कि यह क्षमता छवियों से ईमेल पते निकालने के लिए भी लीवरेज की जा सकती है। नीचे दिया गया उदाहरण वेब पेज पर मौजूद सभी चित्रों के किसी भी ईमेल पते को निकालता है।
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));
जबकि नीचे दिए गए स्क्रैप निर्देश पीडीएफ डाक्यूमेंट्स में पाए गए चित्रों में से किसी भी ईमेल ऐड्रेस को निकालते हैं।
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));