Парсинг сайта Bioring.ru на Python
Сегодня мы будем парсить сайт Bioring.ru на Python
для парсинга нам понадобятся следующие библиотеки :
urllib.request и BeautifulSoup эти библиотеки нужно импортировать в проект from urllib.request import urlopen from bs4 import BeautifulSoup далее мы инициализируем переменную html в которую сохраняем значение страницы которую парсим html = urlopen("http://bioring.ru") затем следующей переменной мы присваиваем значение равное всему HTML содержимому страницы Http://bioring.ru bsObj = BeautifulSoup(html,"html.parser") затем берем и из всего HTML содержимого выводим текст HTML тега h1 print(bsObj.find("h1").get_text()) результат который пойдет в консоль это и есть текст который хранится внутри тега h1 - "Бандажирование желудка : Желудочный бандаж" так-же мы можем посмотреть есть ли на странице фраза "желудочный бандаж" , если добавим еще одну строку в нашу программу print(bsObj.find(text="Желудочный бандаж"))