Saved in:
Bibliographic Details
Main Authors: Silva, Kassyane Nunes da, Maciel, Bruno de Oliveira, Carvalho, Isabela Dambiski Gomes de, Rodrigues, Tarso Bertolini, Santos, Janerson Dias dos, Pinto, Alberjan de Jesus Jean, Lantmann, Orlando Renato Brenner, Carvalho, Hélio Gomes de, Carvalho, Gustavo Dambiski Gomes de
Format: Recurso digital
Language:Portuguese
Published: Zenodo 2025
Subjects:
Online Access:https://doi.org/10.5281/zenodo.15297425
Tags: Add Tag
No Tags, Be the first to tag this record!
Table of Contents:
  • <p><span lang="PT">A Transformação Digital 4.0 envolve tecnologias habilitadoras relacionadas a dados como Big Data, Computação em Nuvem, Aprendizado de Máquina (Machine Learning) e Inteligência Artificial (Artificial Intelligence). Nesse contexto, a</span><span> prática de web scraping, ou coleta de dados web, tem ganhado relevância na era digital por permitir a extração automatizada de grandes volumes de dados da internet, servindo como base para diversos sistemas de análise e tomada de decisão. A técnica envolve três fases principais: o acesso ao site, a extração de informações relevantes e a transformação dos dados para posterior utilização. O</span><span lang="PT"> objetivo deste artigo é analisar as principais ferramentas Python de web scraping. </span><span>Assim, foca na comparação entre quatro ferramentas populares na linguagem Python — Selenium, Scrapy, BeautifulSoup e Lxml — avaliando aspectos como desempenho, facilidade de uso e compatibilidade com diferentes tipos de sites. Também são discutidas implicações legais e éticas do uso dessa técnica, considerando os riscos relacionados ao uso de dados protegidos e à violação dos termos de uso.</span></p>