راهنماي طراح براي جمعآوري دادهها از صفحات HTML توسط Artoo
گردآوريآوري دادههاي حقيقي و واقعي براي طرحهاي ديجيتال شما مي تواند يك بحران حقيقي و واقعي باشد. سواي دسترسي طراحي سايت در مشهد به دادههاي كلاينت ما اكثر اوقات به خودمان متعلق هستيم، به دادههاي مضحك خير چندان جذاب يا اين كه به لورم اپسيوم. ولي نگران نباشيد، Artoo با عدهآوري صفحه هاي HTML براي شما مي تواند به حل اين نقص ياري دهد.
Artoo يك web scraper آراسته ميباشد راياپارس كه به شما اذن ميدهد دادهها را در يك ورقه اينترنت مقصود قرار دهيد و تنها دادههايي را كه ميخواهيد را برگردانيد. اين تماما مشابه به به كار گيري از جيكوئري ميباشد البته تعدادي خصوصيتهاي مازاد داراست. Artoo به برخي از علمهاي مرتبط با سلكتورهاي jQuery و CSS نياز داراست، ahrefs اينها ابزارهاي خير براي آشنايي آن مي باشند و خيلي بهتر كيت ابزارهاي شمارا متقاطع مينمايند.
Artoo چه گونه شغل مينمايد
Artoo در واقع عملكردي ميباشد كه شما مي توانيد در كنسول مرورگر اينترنت خويش انجام نمائيد. مقصود آن رجوع و برگشت دادهها از گروه يا اين كه گروههاي معين و معلوم ساختار HTML از هدف ها مشخص و معلومگرديده بوسيله استفاده كننده ميباشد (از جمله رجوع دادهها از جدول HTML مو جود در كاغذ).
همينطور ميتوانيد به طور خاصخيس كار نماييد. براي مثال ميتوانيد جدول سوم با اسم كلاس my-table، يا اين كه تنها واپسين كاراكتر از واپسين كلمه و واژه رديف و ستون دوم از پايان هر جدول را معين فرماييد. با توان سلكتورها به چنگ آوردن محتوايي كه شما درپي آن ميباشيد مي بايست تختگاز قابل استخراج باشد.
اولين گام شناسايي شيوه كشف كردن دادههاي متبوع ميباشد. آيا تمامي دادههاي جانور در ساختار HTML دارنده اسم كلاس ميباشند؟ پس ما مي توانيم از آن به كار گيري كنيم تا به Artoo بگوييم تمامي دادههاي برگه را با آن اسم كلاس پيدا كن. اين شغل با تحقيق عنصر HTML در مرورگر و مشاهده HTML نپخته ورقه اعمال ميشود.
در شرايطيكه هيچ خصوصيت شناسايي منحصربهشخصي از HTML وجود نداشته باشد، شما بايستي پاره اي خلق كننده باشيد. به ساختار HTML نگاه نمائيد. در نمونه ذيل، كل اسمهاي توليدات در رديف نخستين هر سطر نمايان مي شوند. به اين ترتيب مي بايست بتوانيم آن را براي هر سطر و هر رديف نخستين سطر گزينش كنيم.
براي حصول بهاين مقصود، ما به Artoo مي گوييم تا آحاد دادههاي جانور در جدول را ساخت و ساز نمايد، آن گاه خروجي را محصور مي كنيم، سلكتورها را تصحيح ميكنيم تا صرفا اولين رديف هر سطر را ساختوساز نمايد. ما بهتدريج براي توشه نخستين خروجي را كه تا قبل از اين انتخاب كردهايم را اخذ ميكنيم، البته با چندبار آزمون، خواهيم توانست براي رفع نيازهاي خويش منشحلي ارائه دهيم.
نمونه
در يك پروژه ما سعي بر عدهآوري دادههاي حقيقي وواقعي داريم: ليستي از امكاناتي كه متاع خاصي را ساخت و ساز مينمايد. متاسفانه HTML اينترنتوبسايت كلاينت دارنده ساختار كمتري نسبت به آيدهآلها ميباشد، و محتوا فاقد سلسله مراتب بصري ميباشد. اين فرمان سبب نسخه برداري پيست دستي سوال ها گرديده و دسترسي به دادهها مدتي ارتفاع ميكشد. در اينجاست كه ميقدرت از وجود Artoo خرسند شد.
به شما آرم مي دهيم كه چه فعاليت مي بايست كرد، ما از Cboe market data ي final settlement prices استفاه كردهايم. مقصود ما اين ميباشد كه اسم توليدات را ليست كنيم.
1. اسكريپت Artoo را به bookmarks خويش اضافه نماييد (ميتوانيدراهنماي سريع artoo.js را مشاهده كنيد).
2. به شيتاي كه مي خواهيد دادهها را گردآوريآوري فرماييد برويد، و كنسول را از روش inspector مرورگر گشوده نماييد:
3. براي استارت شغل Artoo، Artoo bookmark را كليك نمائيد.
4. اولين فرمان خويش را وارد فرمائيد: artoo.scrape(‘tbody tr td’) را باطن كنسول مرورگر بنويسيد.
برچسب: طراحي سايت در مشهد،