Back to Question Center
0

سیمالٹ ماہرین کی وضاحت کرتا ہے کہ کس طرح خوبصورت سوپ کے ساتھ ایک ویب سائٹ سکریپ

1 answers:

بہت سارے اعداد و شمار ہیں جو عام طور پر دوسری طرف ایک ایچ ٹی ایم ایل. ایک کمپیوٹر مشین پر، ایک ویب پیج صرف علامات، متن حروف، اور سفید جگہ کا مرکب ہے. ہم ایک ویب صفحہ پر جانے والی حقیقی چیز صرف اس طرح کے مواد ہے جو ہمارے لئے پڑھنے والا ہے. ایک کمپیوٹر ان عناصر کو HTML ٹیگ کے طور پر بیان کرتا ہے. جس فیکٹر کو ہم دیکھتے ہیں اعداد و شمار سے خام کوڈ کو الگ الگ کرتے ہیں اس معاملے میں، ہمارے براؤزر. دوسرے ویب سائٹس جیسے سکریپٹر اس ویب سائٹ کے مواد کو سکریپ کرنے اور بعد میں استعمال کے لۓ اس کو بچانے کے لئے اس مفہوم کا استعمال کرسکتے ہیں.

سادہ زبان میں، اگر آپ کسی مخصوص ویب صفحہ کے لئے ایچ ٹی ایم ایل دستاویز یا ذریعہ فائل کھولیں تو، اس مخصوص ویب سائٹ پر موجود مواد کو دوبارہ حاصل کرنا ممکن ہو گا. یہ معلومات بہت سارے کوڈ کے ساتھ مل کر ایک فلیپ منظر نامہ پر ہوگی. پوری عمل میں ایک غیر منظم انداز میں مواد سے نمٹنے میں شامل ہے. تاہم، ممکنہ طور پر اس معلومات کو منظم طریقے سے منظم کرنے اور پورے کوڈ سے مفید حصوں کو دوبارہ حاصل کرنے کے قابل ہوسکتا ہے.

زیادہ تر معاملات میں، سکریپٹر اپنی سرگرمی کو HTML کی ایک تار حاصل کرنے کے لئے انجام نہیں دیتے ہیں. عام طور پر ایک ختم فائدہ ہوتا ہے جو سب تک پہنچنے کی کوشش کرتی ہے. مثال کے طور پر، جو لوگ انٹرنیٹ مارکیٹنگ کی سرگرمیوں کو انجام دیتے ہیں وہ ویب پیج سے معلومات حاصل کرنے کے لئے منفرد ڈھانچے کی طرح کمانڈ ایف شامل کرنے کی ضرورت ہوسکتی ہے. اس کام کو ایک سے زیادہ صفحات پر مکمل کرنے کے لئے، آپ کو مدد کی ضرورت ہوسکتی ہے اور نہ صرف انسان کی صلاحیتیں. ویب سائٹ سکریپسرس یہ بوٹ ہیں جو گھنٹوں کے معاملات میں ایک لاکھ صفحات کے ساتھ ایک ویب سائٹ کو سکریپ کر سکتے ہیں. پوری عمل کو سادہ پروگرام ذہن میں لے جانے والی نقطہ نظر کی ضرورت ہوتی ہے. کچھ پروگرامنگ زبانوں جیسے پڈون، صارفین کو کچھ کرالر کوڈ دے سکتا ہے جو ویب سائٹ کے اعداد و شمار کو سکریپ کر سکتے ہیں اور اسے ایک خاص مقام پر ڈمپ کر سکتے ہیں.

سکریپنگ کچھ ویب سائٹس کے لئے خطرناک طریقہ کار ہوسکتا ہے. سکریپنگ کی مشروعیت کے بارے میں بہت سے خدشات موجود ہیں. سب سے پہلے، کچھ لوگ اپنے اعداد و شمار پر نجی اور رازداری پر غور کرتے ہیں. یہ رجحان یہ ہے کہ کاپی رائٹ کے مسائل، ساتھ ساتھ غیر معمولی مواد کے رساو، سکریپنگ کی صورت میں ہوسکتا ہے. کچھ معاملات میں، لوگ آف لائن استعمال کرنے کیلئے پوری ویب سائٹ ڈاؤن لوڈ کرتے ہیں. مثال کے طور پر، حالیہ ماضی میں، 3 ٹیپ نامی ایک ویب سائٹ کے لئے کریگسل فہرست کیس تھا. یہ سائٹ ویب سائٹس کی مواد کو سکریپنگ کر رہا تھا اور درجہ بندی کے لئے ہاؤس لسٹنگ کو دوبارہ شائع کر رہا تھا. بعد میں انہوں نے 3 ٹیپوں کو اپنی سابقہ ​​سائٹس پر 1،000،000 ڈالر ادا کی.

بی ایس ایک ماڈیول یا پیکج کے طور پر ایک سیٹ کے اوزار (پجنا زبان) ہے. ویب سائٹ کے اعداد و شمار سے ویب سائٹ کو سکریپ کرنے کے لئے آپ خوبصورت سوپ استعمال کرسکتے ہیں. کسی سائٹ کو سکریپ کرنے اور ڈیٹا کو ایک تشکیل شدہ شکل میں حاصل کرنے کے لئے ممکن ہے جو آپ کی پیداوار سے ملتا ہے. آپ ایک URL کو پار کر سکتے ہیں اور پھر اپنی برآمدی شکل میں مخصوص پیٹرن مقرر کر سکتے ہیں. بی ایس میں، آپ ایکس ایم ایل جیسے مختلف فارمیٹس میں برآمد کرسکتے ہیں. شروع کرنے کے لئے، آپ کو بی ایس کے مہذب ورژن کو انسٹال کرنے کی ضرورت ہے اور چند پجنون کی بنیادیات کے ساتھ شروع کرنا ہوگا. پروگرامنگ کا علم یہاں ضروری ہے.

December 7, 2017
سیمالٹ ماہرین کی وضاحت کرتا ہے کہ کس طرح خوبصورت سوپ کے ساتھ ایک ویب سائٹ سکریپ
Reply