Back to Question Center
0

سیمالٹ: پی ایچ پی ویب صفحہ سکریپنگ کرنے کے لئے 3 مراحل

1 answers:

ویب سکریپنگ، ویب ڈیٹا نکالنے یا ویب کٹائی بھی کہا جاتا ہے ویب سائٹ یا بلاگ سے ڈیٹا نکالنے کا عمل. اس معلومات کے بعد میٹا ٹیگ، میٹا تشریحات، ویب سائٹ پر مطلوبہ الفاظ اور لنکس قائم کرنے کے لئے استعمال کیا جاتا ہے، اس کے تلاش انجن کے نتائج میں اس کی مجموعی کارکردگی کو بہتر بنانے میں استعمال ہوتا ہے.

اعداد و شمار کو سکریپ کرنے کے لئے دو اہم تراکیب استعمال کیے جاتے ہیں:

  • دستاویز کی سماعت - اس میں ایک XML یا ایچ ٹی ایم ایل دستاویز شامل ہے جس میں ڈوم (دستاویز آبجیکٹ) ) فائلوں. پی ایچ پی ہمیں عظیم ڈوم توسیع کے ساتھ فراہم کرتا ہے.
  • باقاعدگی سے اظہار - یہ باقاعدگی سے اظہار کے فارم میں ویب دستاویزات سے ڈیٹا کو سکریپنگ کا ایک طریقہ ہے.

تیسرے فریق کی ویب سائٹ کے سکریپنگ ڈیٹا کے ساتھ مسئلہ اس کاپی رائٹ سے متعلق ہے کیونکہ آپ کو اس ڈیٹا کا استعمال کرنے کی اجازت نہیں ہے. لیکن پی ایچ پی کے ساتھ، آپ آسانی سے کاپی رائٹ یا کم معیار کے ساتھ منسلک مسائل کے بغیر ڈیٹا کو سکریپ کر سکتے ہیں. پی ایچ پی کے پروگرامر کے طور پر، آپ کوڈنگ مقاصد کے لئے مختلف ویب سائٹس سے ڈیٹا کی ضرورت ہوسکتی ہے. یہاں ہم نے وضاحت کی ہے کہ دیگر سائٹوں سے مؤثر طریقے سے ڈیٹا کیسے حاصل کرنا ہے، لیکن اس سے پہلے، آپ کو ذہن میں برداشت کرنا چاہئے کہ آخر میں آپ انڈیکس.php یا scrape.js فائلوں کو حاصل کریں گے.

مرحلہ نمبر 1: ویب سائٹ یو آر ایل میں داخل ہونے کیلئے فارم تشکیل دیں:

سب سے پہلے، آپ کو جمع کرائیں بٹن پر کلک کرکے انڈیکس.php میں فارم بنانا اور ڈیٹا کو سکریپنگ کیلئے ویب سائٹ یو آر ایل درج کریں.



ویب سائٹ یو آر ایل درج کریں ڈیٹا کو سکریپ کرنے کے لئے



مرحلہ 2: ویب سائٹ کے ڈیٹا حاصل کرنے کے لئے پی ایچ پی فنکشن بنائیں:

دوسرا قدم پی ایچ پی کی تقریب scrape.php فائل میں سکریپ کے طور پر یہ اعداد و شمار حاصل کرنے اور یو آر ایل لائبریری کا استعمال کرنے میں مدد ملے گی. یہ آپ کو کسی بھی مسئلہ کے بغیر مختلف سرورز اور پروٹوکول کے ساتھ منسلک اور بات چیت کرنے کی بھی اجازت دے گی..

فنکشن سکریپیٹیٹا ($ ویب سائٹ_ولل) {

اگر (! function_exists ('curl_init')) {

مرنے ('cURL انسٹال نہیں ہے. برائے مہربانی انسٹال کریں اور دوبارہ کوشش کریں. ')؛

}

$ curl = curl_init

؛

curl_setopt ($ curl، CURLOPT_URL، $ website_url)؛

curl_setopt ($ curl، CURLOPT_RETURN ٹرانسفر، سچ)؛

$ پیداوار = curl_exec ($ curl)؛

curl_close ($ curl)؛

$ پیداوار واپسی؛

}

یہاں، ہم دیکھ سکتے ہیں کہ پی ایچ پی کی cURL کو مناسب طریقے سے نصب کیا گیا ہے یا نہیں. افعال کے علاقے میں تین اہم cURL کو استعمال کرنا ہوگا اور curl_init

سیشن کو ابتداء میں مدد ملے گی، curl_exec

اسے انجام دے گا اور curl_close

کنکشن کو بند کرنے میں مدد ملے گی. متغیرات جیسے CURLOPT_URL ویب سائٹ یو آر ایل کو قائم کرنے کیلئے استعمال کیا جاتا ہے جو ہمیں سکریپ کرنے کی ضرورت ہے. دوسرا CURLOPT_RETURNTRANSFER اس کے ڈیفالٹ فارم کے مقابلے میں متغیر فارم میں سکریپریج شدہ صفحات کو ذخیرہ کرنے میں مدد کرے گی، جو آخر میں پورے ویب صفحہ کو ظاہر کرے گا.

مرحلہ 3: ویب سائٹ سے سکریپ کے مخصوص ڈیٹا:

یہ آپ کے پی ایچ پی فائلوں کی فعالیتوں کو سنبھالنے اور آپ کے ویب صفحے کے مخصوص حصے کو سکریپ کرنے کا وقت ہے. اگر آپ کسی خاص یو آر ایل کے تمام اعداد و شمار نہیں چاہتے ہیں تو، آپ کو CURLOPT_RETURNTRANSFER متغیرات کو استعمال کرنا چاہئے اور اس کے حصوں کو اجاگر کرنا چاہئے جسے آپ سکریپ کرنا چاہتے ہیں.

اگر (جاری) ($ _ POST ['submit'])) {

$ html = scrape ویب سائٹائٹ ($ _ پوسٹر ['website_url'])؛

$ start_point = strpos ($ HTML، 'تازہ ترین مراسلہ')؛

$ end_point = strpos ($ HTML، ''، $ start_point)؛

$ لمبائی = $ end_point- $ start_point؛

$ HTML = substr ($ HTML، $ start_point، $ length)؛

گونج $ html؛

}

ہم آپ کو ان کوڈوں کا استعمال کرنے سے پہلے پی ایچ پی اور باقاعدگی سے اشارے کے بنیادی علم کو فروغ دینے یا ذاتی مقاصد کے لئے کسی مخصوص بلاگ یا ویب سائٹ کو سکریپ کرنے کے لئے مشورہ دیتے ہیں.

December 8, 2017
سیمالٹ: پی ایچ پی ویب صفحہ سکریپنگ کرنے کے لئے 3 مراحل
Reply