На пути к улучшению своего английского я решил еженедельно писать статью о том, что я узнал за эту неделю, и я ожидаю ваших отзывов
Поехали :
На этой неделе я закончил курс по Coursera под названием
«Веб-данные Python Access»
Каждый веб-сайт представляет собой набор данных (строки, целые числа, фотографии, видео и т. д.).
Итак, как мы можем использовать эти данные ?
Было такое выражение
Веб-скраппинг»
— это метод извлечения информации с веб-сайтов.
На любом веб-сайте есть типы форм данных.
1) XML Расширяемый язык разметки
Это язык разметки, который определяет набор правил для кодирования документов в формат, который удобочитаем как для человека, так и для машиночитаемости.
2) JSON Обозначение объектов JavaScript
Это упрощенный формат обмена данными. Людям легко читать и писать. Он основан на подмножестве языка программирования JavaScript.
Итак, как вы можете использовать это в python?
Это просто библиотеки, которые вам нужно импортировать.
Создайте необходимые объекты из классов и используйте их.
Например:
›››импорт JSON
›››json_string = ‘{“first_name”: “Guido”, “last_name”:”Rossum”}’
›››parsed_json = json.loads(json_string)
Вы можете узнать больше о JSON в этой документации.
Это похоже на XML, у вас будет файл XML или веб-страница.
Например:
›››импорт xml.etree.ElementTree как ET
›››tree = ET.parse(‘country_data.xml’)
›››root = tree.getroot( )
Вы можете найти больше в этой документации.
Но прежде чем приступить к очистке любого веб-сайта, необходимо убедиться, что этот веб-сайт доступен для очистки.
В этом курсе была еще одна тема.
Это Регулярные выражения
Когда я начинал свой путь в качестве разработчика Python, я слышал о регулярных выражениях и думал, что это сложно.
Я должен был быть в стороне от этого.
Но я обнаружил, что это просто, и есть много веб-сайтов, которые объясняют это и помогают понять, как его использовать.
После всего. Курс был хорошим, и я изучил много предметов и техник.
Я рекомендую этот курс всем, кто хочет начать веб-разработку.