वेब पर कब्जा और परिवर्तित करने के लिए उपकरण
GrabzIt के ऑनलाइन समुदाय

नौसिखिया को सहायता की आवश्यकता है (मूल रूप से गलत क्षेत्र में पोस्ट किया गया)

GrabzIt के स्क्रीनशॉट टूल का उपयोग करने के तरीके के बारे में प्रश्न पूछें।

हाय समुदाय,

कृपया मेरी अज्ञानता को क्षमा करें। मैं एक व्यवसायी व्यक्ति हूं, कोई तकनीकी व्यक्ति नहीं। मुझे यकीन है कि यह मेरे सवालों में चमकेगा।

क्या वेब स्क्रैप टूल में अधिक मजबूत चयन और नियंत्रण मापदंडों का उपयोग करना संभव है, जैसे स्क्रीनशॉट टूल के साथ यूआरएल पैटर्न (सबसे महत्वपूर्ण) और फॉलो लाइन्स नियंत्रण सेटिंग्स। मैं बस इतना चाहता हूं कि उस यूआरएल से एक बेस यूआरएल और विस्तारित डोमेन को क्रॉल किया जाए, जिसमें यह सीमा हो कि क्रॉल कितनी परतों तक जाएगा। मेरा उद्देश्य केवल कुछ डोमेन सेट से समाचार लेख प्राप्त करना है। मैं केवल टेक्स्ट को आउटपुट के रूप में लेना पसंद करूंगा लेकिन मैं docx में वितरित की जा रही छवियों के साथ रह सकता हूं। स्क्रीनशॉट टूल से आउटपुट मेरी आधार आवश्यकता के साथ मेरे लिए बहुत अच्छा है लेकिन चयन और नियंत्रण कार्यक्षमता बहुत सीमित है। मुझे उस टूल के मानक इनपुट का उपयोग करने के लिए सभी उपडोमेन और आलेख नाम जानना होगा, और यह यथार्थवादी नहीं है।

मैंने सोचा कि स्क्रैपर बहुत अच्छा होगा और मैंने इसका उपयोग करना शुरू कर दिया, लेकिन फिर मुझे तुरंत पता चला कि उस उपकरण की कीमत और प्रतिबंध काफी अधिक हैं! उस लागत संरचना के आधार पर उसका उपयोग करना मेरे लिए संभव नहीं है।

ध्यान दें, मेरे पास एक कोडर लेखन पायथन है जो एपीआई के साथ खेल रहा है लेकिन वह इस टूल के बारे में जानकार नहीं है और हमें मेरी अपेक्षाओं पर एक दूसरे के साथ स्पष्ट रूप से संवाद करने में चुनौतियों का सामना करना पड़ रहा है, इसलिए मुझे चिंता है कि उसका काम उस दिशा में जा रहा है जो होगा मेरे लिए इष्टतम नहीं होगा. विशेष रूप से, मैंने उससे कहा कि मैं वेब स्क्रैपर के समान ही इनपुट नियंत्रण चाहता हूं, लेकिन स्क्रीशॉट टूल के लिए। लेकिन मुझे नहीं लगता कि वह मेरी समस्या को समझती है या उसकी सराहना करती है। क्या एपीआई का उपयोग करके वेबस्क्रैप्टर के लिए अत्यधिक उच्च मूल्य का भुगतान किए बिना मजबूत चयन मानदंड का लाभ उठाना संभव है

किसी भी मार्गदर्शन की काफी सराहना की जाएगी।

आपका अग्रिम में ही बहुत धन्यवाद!!!
1 फरवरी 2024 को अज्ञात द्वारा पूछा गया

1 फरवरी 2024 को अज्ञात द्वारा पूछा गया

हाय,

कोई बात नहीं, मैं आपके सवालों का जवाब देने की पूरी कोशिश करूंगा।

आम तौर पर एक वेब स्क्रैप या तो किसी वेबसाइट या यूआरएल पैटर्न तक ही सीमित होता है, अन्यथा इसकी प्रकृति के कारण internet लिंक का अनुसरण करने से वेब स्क्रैप कभी ख़त्म नहीं होगा।

स्क्रीनशॉट टूल निर्दिष्ट यूआरएल के स्क्रीनशॉट एक बार, एक शेड्यूल पर या जब वेब पेज बदलते हैं तो लेता है। यदि आपके पास यूआरएल की एक सूची है जिसे आप कैप्चर करना चाहते हैं तो इसे आयात किया जा सकता है into स्क्रीनशॉट टूल।

एपीआई के साथ आप स्क्रीनशॉट को ट्रिगर करने के लिए अपने तर्क का उपयोग कर सकते हैं। तो आप जो कर रहे हैं उसके लिए मुझे लगता है कि आपको किसी प्रकार के कस्टम वेब स्क्रैपर की आवश्यकता होगी, जो एपीआई को ट्रिगर करेगा। 

उम्मीद है की यह मदद करेगा।

GrabzIt सपोर्ट द्वारा 1 फरवरी 2024 को उत्तर दिया गया