पार्सर म्हणजे काय? पार्सिंग: ते काय आहे आणि ते कसे तयार केले जाते. स्क्रॅपिंगच्या नैतिक आणि तांत्रिक अडचणी

विंडोज फोनसाठी 06.04.2019
विंडोज फोनसाठी

विस्तार स्थापित करण्यात अक्षमता समस्यांचा परिणाम असू शकते सहविस्तार, फायरफॉक्स प्राधान्ये किंवा फायरफॉक्सची आवृत्ती तुम्ही आहातवापरून हा लेख स्थापना समस्यांच्या विविध कारणांचे वर्णन करतो आणि आपण त्यांचे निराकरण करण्यासाठी काय करू शकता.

सामग्री सारणी

ॲड-ऑन सुसंगत नाही

प्रत्येक ॲड-ऑनमधील अंतर्गत फाइल फायरफॉक्स आवृत्त्यांची श्रेणी दर्शवते ज्यासह विस्तार सुसंगत आहे. Mozilla च्या फायरफॉक्स ॲड-ऑन्स क्षेत्रात, तुम्ही आवृत्ती सुसंगतता माहितीचे पुनरावलोकन करू शकता पृष्ठप्रत्येक उपलब्ध विस्तारासाठी.

जर तुमची Firefox ची स्थापित आवृत्ती त्या श्रेणीमध्ये बसत नसेल, तर ॲड-ऑन स्थापित केल्याने ॲड-ऑन सुसंगत नाही हे दर्शविणारी त्रुटी येते. तुमची Firefox ची आवृत्ती ॲड-ऑनशी विसंगत असल्यास, तुम्ही हे करू शकता:

  • फायरफॉक्सच्या नवीनतम आवृत्तीवर अद्यतनित करा. अधिक माहितीसाठी, नवीनतम रिलीझवर फायरफॉक्स अद्यतनित करा पहा.
  • तुमच्या फायरफॉक्सच्या आवृत्तीशी सुसंगत ॲड-ऑनची आवृत्ती शोधा. फायरफॉक्स ॲड-ऑन वेबसाइटवर सहसा प्रत्येक ॲड-ऑनची सर्वात अद्ययावत आवृत्ती असते.
  • वेगळा विस्तार वापरा. अनेक विस्तारांसाठी, समान कार्यक्षमता प्रदान करणारे समान विस्तार आहेत. अधिक माहितीसाठी, फायरफॉक्स ॲड-ऑन पहा.

फायरफॉक्सने या साइटला असत्यापित ॲड-ऑन स्थापित करण्यापासून प्रतिबंधित केले आहे

Firefox च्या नवीन आवृत्त्या तृतीय-पक्ष ॲड-ऑन अवरोधित करून मालवेअर आणि ब्राउझर अपहरणकर्त्यांपासून तुमचे संरक्षण करतात नाहीडिजिटल स्वाक्षरी आणि Mozilla द्वारे सत्यापित. अधिक माहितीसाठी, फायरफॉक्समध्ये ॲड-ऑन साइनिंग पहा.

ॲड-ऑनमध्ये स्थिरता किंवा सुरक्षा समस्या निर्माण होण्याचा उच्च धोका आहे आणि ते स्थापित केले जाऊ शकत नाही

काही ॲड-ऑन्स असुरक्षित असल्यामुळे Mozilla द्वारे ब्लॉक केले गेले आहेत. अधिक माहितीसाठी, ॲड-ऑन पहा ज्यामुळे स्थिरता किंवा सुरक्षा समस्या ब्लॉकलिस्टमध्ये ठेवल्या जातात.

फायरफॉक्सने साइटला तुम्हाला सॉफ्टवेअर इन्स्टॉल करण्यास सांगण्यापासून रोखले

डीफॉल्टनुसार, फायरफॉक्स तुम्हाला केवळ विश्वसनीय वेबसाइटवरून ॲड-ऑन स्थापित करण्याची परवानगी देतो. तर जाळेतुम्ही ज्या साइटवरून ॲड-ऑन इन्स्टॉल करत आहात ती विश्वसनीय वेबसाइट्सच्या सूचीमध्ये नाही, वेब पेजच्या वरच्या बाजूला खालीलप्रमाणे संदेशासह एक पिवळी पट्टी दिसते:

फायरफॉक्सने या साइटला (www.example.com) तुम्हाला तुमच्या संगणकावर सॉफ्टवेअर इंस्टॉल करण्यास सांगण्यापासून रोखले आहे.

साइटला परवानगी देण्यासाठी, पिवळ्या पट्टीमध्ये परवानगी द्या वर क्लिक करा.

विश्वसनीय साइट सूचीमध्ये साइट जोडण्यासाठी:

तुम्हाला ॲड-ऑन स्थापित करण्याऐवजी डाउनलोड करण्यास सांगितले जाते

काही वेबसाइट्स डाऊनलोड म्हणून ॲड-ऑन देतात, ज्यासाठी तुम्हाला फाइल इंस्टॉल करण्यापूर्वी तुमच्या कॉम्प्युटरवर डाउनलोड करावी लागते.

  • या फाईल्स सहसा असतात .xpiकिंवा .जरफाइल्स

डाउनलोड त्रुटी -228

अक्षम कॅशे

फायरफॉक्स कॅशे अक्षम केल्यावर हा त्रुटी संदेश येऊ शकतो. फायरफॉक्स कॅशे पुन्हा सक्षम करण्यासाठी:

इतर सॉफ्टवेअर

काहीवेळा, फायरवॉल किंवा स्पायवेअर स्क्रीनर डाउनलोड त्रुटी -228 संदेशास कारणीभूत ठरू शकतात. तुम्ही CA फायरवॉल वापरत असल्यास, विंडोज डिफेंडर, किंवा Spybot S&D ("Teatimer" वैशिष्ट्य) चा निवासी पर्याय, तुमची सिस्टीम ॲड-ऑनला इंस्टॉल करण्याची परवानगी देते की नाही हे पाहण्यासाठी तुम्ही सॉफ्टवेअर तात्पुरते अक्षम केले पाहिजे. अधिक माहितीसाठी, तुमच्या सॉफ्टवेअरसोबत आलेले दस्तऐवज पहा.

तुम्ही इंस्टॉल लिंक क्लिक करता तेव्हा काहीही होत नाही

तुम्ही इंस्टॉल लिंकवर क्लिक केल्यास आणि काहीही झाले नाही, तर तुम्ही JavaScript सक्षम असल्याचे सत्यापित केले पाहिजे. अधिक माहितीसाठी, परस्परसंवादी वेब पृष्ठांसाठी JavaScript सेटिंग्ज आणि प्राधान्ये पहा.

दूषित विस्तार फाइल्स

एक्स्टेंशन इन्स्टॉल करण्याचा प्रयत्न करताना दूषित एक्स्टेंशन कॉन्फिगरेशन फायली समस्या निर्माण करू शकतात. या फायली हटवण्याने फायरफॉक्स पुढच्या वेळी सुरू झाल्यावर त्या पुन्हा तयार करेल (कोणताही भ्रष्टाचार काढून टाकेल). या फायली हटवून तुम्ही तुमचे विस्तार किंवा त्यांची सेटिंग्ज गमावणार नाही.

इतर विस्तारांसह विरोधाभास

दुसरा स्थापित केलेला विस्तार नवीन विस्तारांच्या स्थापनेत हस्तक्षेप करू शकतो. स्थापित करा नवीनफायरफॉक्स मध्ये विस्तार

फायरफॉक्स अजूनही माझा आवडता ब्राउझर आणि डीफॉल्ट ब्राउझर आहे. असूनही सर्व प्रकारचे विचित्र निर्णयत्याचे विकसक अजूनही आहेत पर्यायी उपायत्यांना बायपास करण्यासाठी. आवृत्ती 43 पासून प्रारंभ करून, फायरफॉक्स डिफॉल्टनुसार स्वाक्षरी नसलेल्या ॲड-ऑनची स्थापना अवरोधित करते. अर्थात, हे आमच्या सुरक्षिततेची खात्री करण्यासाठी, दुर्भावनापूर्ण ॲड-ऑन्स आणि तत्सम उच्च-फ्लो ब्ला ब्ला ब्ला प्रसार रोखण्यासाठी सर्वोत्तम हेतूने केले गेले. ॲड-ऑन डेव्हलपरने ते Mozilla कडे पुनरावलोकन आणि मंजुरीसाठी सबमिट करणे आवश्यक आहे, त्यानंतर ॲड-ऑन अधिकृत कॅटलॉगद्वारे वितरित केले जाऊ शकतात.

माझ्यासह अनेक वापरकर्त्यांना हे नावीन्य आवडले नाही. उदाहरणार्थ, मी अनेक जुने, परंतु तरीही कार्यरत ॲड-ऑन वापरतो, ज्याचा विकास बर्याच वर्षांपूर्वी थांबला होता. आणि माझ्या गरजा पूर्ण करण्यासाठी मी स्वत: काही ऍडिशन्स सुधारित करतो, अशा बदलांनंतर, डिजिटल स्वाक्षरी अवैध होते. सुदैवाने, नंतर विकसकांनी ब्राउझर सेटिंग्जमध्ये एक पर्याय सोडला जो तुम्हाला स्थापित ॲड-ऑनच्या डिजिटल स्वाक्षरी तपासणे अक्षम करण्यास अनुमती देतो.



आवृत्ती ४८ पासून सुरू करून, फ्रीबी गेली आहे, फायरफॉक्स यापुढे हे पॅरामीटर स्वीकारत नाही. त्याचे मूल्य काहीही असले तरी, तुम्ही कोणतेही स्वाक्षरी न केलेले विस्तार स्थापित करण्याचा प्रयत्न केल्यास, तुम्हाला धोक्याची चेतावणी दिसेल आणि स्थापना अवरोधित केली जाईल. परंतु एक मार्ग आहे ज्याद्वारे आपण अद्याप स्थापित करू शकता तृतीय पक्ष विस्तारफायरफॉक्स ब्राउझरमध्ये.



प्रथम आपण स्विच करणे आवश्यक आहे फायरफॉक्स अद्यतने ESR (विस्तारित समर्थन प्रकाशन) चॅनेलवर. ही संस्थांमध्ये वापरण्यासाठी डिझाइन केलेली ब्राउझरची विस्तारित समर्थन आवृत्ती आहे. थेट शीर्षस्थानी स्थापित करते चालू आवृत्तीफायरफॉक्स, सर्व सेटिंग्ज ठिकाणी राहतील, काहीही क्रॅश होत नाही.



आता टाइप करून सेटिंग्ज पेजवर जा पत्ता लिहायची जागा बद्दल:कॉन्फिगरेशन. तेथे आपल्याला पॅरामीटर सापडतो xpinstall.signatures.requiredआणि त्याचे मूल्य वर स्विच करण्यासाठी डबल-क्लिक करा खोटे. एवढेच, आता तुम्ही कोणत्याही समस्यांशिवाय स्वाक्षरी न केलेले किंवा सुधारित केलेल्या अद्यतनांसह कोणतीही अद्यतने स्थापित करू शकता. फायरफॉक्सच्या "प्रभावी व्यवस्थापकां" कडून आणखी एक मूर्खपणा यशस्वीरित्या दूर केला गेला आहे.

प्रत्येकाने अशा परिस्थितीचा सामना केला आहे जिथे त्यांना एकत्रित करणे आणि व्यवस्थित करणे आवश्यक आहे मोठ्या संख्येनेमाहिती च्या साठी मानक कार्येवेबसाइट एसइओ ऑप्टिमायझेशनसाठी तयार सेवा आहेत, उदाहरणार्थ, नेटपीक तपासक - प्रतिस्पर्धी साइट्सच्या कामगिरीची तुलना करण्यासाठी किंवा नेटपीक स्पायडर- पार्सिंगसाठी अंतर्गत माहितीसाइटवर. पण जर कार्य अतुलनीय असेल आणि तयार उपायनाही? दोन मार्ग आहेत: सर्वकाही व्यक्तिचलितपणे आणि बर्याच काळासाठी किंवा वाहन चालविणे नियमित प्रक्रियामॅट्रिक्समध्ये, ते स्वयंचलित करा आणि अनेक वेळा जलद निकाल मिळवा. हे प्रकरण आहे ज्याबद्दल आपण बोलू.

वेबसाइट पार्सिंग म्हणजे काय आणि ते का आवश्यक आहे?

किमोनो- अंतर्ज्ञानी स्क्रॅपर सेट करण्यासाठी शक्तिशाली आणि द्रुत स्पष्ट इंटरफेस. तुम्हाला इतर साइटवरील डेटाचे विश्लेषण करण्याची आणि नंतर अपडेट करण्याची अनुमती देते. फुकट.

तुम्ही एकमेकांना चांगल्या प्रकारे जाणून घेऊ शकता आणि ते कसे वापरावे (रशियनमध्ये) किंवा moz.com (इंग्रजीमध्ये) वर एक लहान पुस्तिका मिळवू शकता. चला किमोनो वापरून काहीतरी चांगले विश्लेषित करण्याचा प्रयत्न करूया. उदाहरणार्थ, देशातील शहरे 2 मधील रिसॉर्ट्सच्या सूचीसह आम्ही तयार केलेल्या शहरांसह सारणीची पूर्तता करू या. किमोनो लॅब्स वापरून हे कसे लागू केले जाऊ शकते. आम्हाला आवश्यक असेल:

  • Google Chrome साठी अनुप्रयोग - किमोनो;
  • Google डॉक्स स्प्रेडशीट.

1. आम्हाला आवश्यक असलेल्या माहितीसह एक साइट सापडते - म्हणजे, देश आणि त्यांच्या रिसॉर्ट्सची यादी. तुम्हाला जिथे डेटा मिळवायचा आहे ते पेज उघडा.

2. उजवीकडे असलेल्या किमोनो आयकॉनवर क्लिक करा वरचा कोपराक्रोम.

3. पृष्ठाचे ते भाग निवडा जिथून डेटा पार्स करायचा आहे. आपल्याला हायलाइट करण्याची आवश्यकता असल्यास नवीन प्रकारत्याच पृष्ठावरील डेटा, उजवीकडे “+” वर क्लिक करा मालमत्ता 1"- आम्ही किमोनोला अशा प्रकारे सूचित करतो की हा डेटा नवीन स्तंभात ठेवला जावा.

4. कुरळे ब्रेसेसवर क्लिक करणे<>आणि निवडत आहे " CSV", आपण टेबलमध्ये निवडलेला डेटा कसा स्थित असेल ते पाहू शकता.

5. जेव्हा सर्व डेटा तपासला जातो:

  • क्लिक करा " झाले" (वरच्या उजव्या कोपर्यात);
  • API ला तुमच्या खात्याशी लिंक करण्यासाठी किमोनो मध्ये लॉग इन करा;
  • भविष्यातील API चे नाव प्रविष्ट करा;
  • क्लिक करा " API तयार करा».

6. API तयार झाल्यावर, Google स्प्रेडशीटवर जा जिथे आम्हाला निवडलेला डेटा लोड करायचा आहे. निवडा " किमोनोशी कनेक्ट करा"आणि आमच्या API च्या नावावर क्लिक करा -" रिसॉर्ट्स" देशांची यादी आणि रिसॉर्ट शहरांसह पृष्ठांचे दुवे वेगळ्या पत्रकावर अपलोड केले आहेत.

7. साइटवर परत जा, आयर्लंडचे उदाहरण घ्या आणि पुन्हा किमोनोद्वारे शहरे निवडा ज्यांचे विश्लेषण करणे आवश्यक आहे. आम्ही एक API तयार करतो, त्याला " देशांमध्ये रिसॉर्ट्स».

9. मध्ये " क्रॉल धोरण» निवडा » स्रोत API मधील URL" सर्व API च्या ड्रॉप-डाउन सूचीसह फील्ड दिसते. आम्ही पूर्वी तयार केलेले API निवडा " रिसॉर्ट्स" आणि त्यातून आपोआप लोड होते URL ची सूचीपार्सिंग साठी. निळ्या बटणावर क्लिक करा " क्रॉल सुरू करा"(क्रॉलिंग सुरू करा) आणि पार्सिंग स्थितीचे निरीक्षण करा. किमोनो पृष्ठे क्रॉल करते, पूर्वी निर्दिष्ट केलेल्या टेम्पलेटनुसार डेटाचे विश्लेषण करते आणि ते सारणीमध्ये जोडते - म्हणजेच ते सर्व काही आयर्लंडप्रमाणेच करते, परंतु इतर सर्व देशांसाठी जे स्वयंचलितपणे आणि आमच्या सहभागाशिवाय प्रविष्ट केले गेले होते.

10. सारणी तयार झाल्यावर, आम्ही किमोनो लॅब्सला Google सारणीसह समक्रमित करतो - अगदी त्याचप्रमाणे आम्ही सहाव्या बिंदूमध्ये केले. परिणामी, डेटासह दुसरी शीट टेबलमध्ये दिसते.

समजा, आम्हाला टेबलमध्ये गंतव्य शहराच्या देशातील सर्व रिसॉर्ट शहरे दाखवायची आहेत. साठी सूत्रे वापरून आम्ही किमोनो शीटवरील डेटावर प्रक्रिया करतो Google पत्रक, आणि एका ओळीत सिडनी वगळता ऑस्ट्रेलियात तुम्ही अजूनही आराम करू शकता अशा शहरांची सूची प्रदर्शित करा.

उदाहरणार्थ, हे असे केले जाऊ शकते. वापरून डेटा ॲरे (शहरांची सूची) लेबल करा तार्किक कार्येआणि सेलचे मूल्य TRUE किंवा FALSE वर परत करत आहे. खालील उदाहरण वापरून, आम्ही विशेषत: ऑस्ट्रेलियामध्ये असलेली शहरे ओळखली आहेत:

  • TRUE = शहर ऑस्ट्रेलियामध्ये आहे;
  • FALSE = शहर दुसऱ्या देशात आहे.

TRUE लेबल्स वापरून, आम्ही प्रक्रिया केलेल्या श्रेणीची सुरुवात आणि शेवट निश्चित करतो आणि या श्रेणीशी संबंधित शहरे एका ओळीत प्रदर्शित करतो.

सादृश्यतेने, आम्ही इतर देशांसाठी रिसॉर्ट शहरे मिळवू शकतो.

आम्ही विशेषत: येथे एक बऱ्यापैकी साधे दिले आहे आणि चरण-दर-चरण उदाहरण- सूत्र क्लिष्ट असू शकते, उदाहरणार्थ, आपण ते बनवू शकता जेणेकरून आपल्याला फक्त स्तंभ C मध्ये देश प्रविष्ट करणे आवश्यक आहे आणि इतर सर्व गणना आणि ओळीतील शहरांचे प्रदर्शन आपोआप होते.

ऑटोमेशन परिणाम

सुरुवातीला नमूद केल्याप्रमाणे, आम्हाला नियमितपणे समान प्रकारच्या 20 टेबल्स तयार करण्याची आवश्यकता आहे. ही एक नियमित प्रक्रिया आहे जी प्रति टेबल 40-50 मिनिटे आणि प्रत्येक 20 तुकड्यांसाठी 16 तासांचा वेळ घेते. सहमत आहे, समान चिन्हांसाठी 2 कामकाजाचे दिवस हा वेळेचा अवास्तव अपव्यय आहे. ऑटोमेशननंतर, एका टेबलला 5-10 मिनिटे लागतात, आणि 20 - सुमारे 2 तास. टेबलमध्ये 17 सेल आहेत, 5 स्त्रोतांकडून विश्लेषण केले जाते. स्रोत डेटासह फक्त 2 सेल भरल्यावर सारणी आपोआप भरली जाते.

पार्सिंग सेट अप आणि स्वयंचलित करण्यासाठी एकूण 30 तासांचा वेळ लागला, म्हणजेच, दुसऱ्या 20 टेबल्स तयार करण्याच्या टप्प्यावर घालवलेला वेळ आधीच "फेड" होईल.



आम्ही वाचण्याची शिफारस करतो

वर