Saved in:
| Main Authors: | , , , , , , , , |
|---|---|
| Format: | Recurso digital |
| Language: | Portuguese |
| Published: |
Zenodo
2025
|
| Subjects: | |
| Online Access: | https://doi.org/10.5281/zenodo.15297425 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Table of Contents:
- <p><span lang="PT">A Transformação Digital 4.0 envolve tecnologias habilitadoras relacionadas a dados como Big Data, Computação em Nuvem, Aprendizado de Máquina (Machine Learning) e Inteligência Artificial (Artificial Intelligence). Nesse contexto, a</span><span> prática de web scraping, ou coleta de dados web, tem ganhado relevância na era digital por permitir a extração automatizada de grandes volumes de dados da internet, servindo como base para diversos sistemas de análise e tomada de decisão. A técnica envolve três fases principais: o acesso ao site, a extração de informações relevantes e a transformação dos dados para posterior utilização. O</span><span lang="PT"> objetivo deste artigo é analisar as principais ferramentas Python de web scraping. </span><span>Assim, foca na comparação entre quatro ferramentas populares na linguagem Python — Selenium, Scrapy, BeautifulSoup e Lxml — avaliando aspectos como desempenho, facilidade de uso e compatibilidade com diferentes tipos de sites. Também são discutidas implicações legais e éticas do uso dessa técnica, considerando os riscos relacionados ao uso de dados protegidos e à violação dos termos de uso.</span></p>