Calificación:
  • 0 voto(s) - 0 Media
  • 1
  • 2
  • 3
  • 4
  • 5
Ayuda con código recorrer web
#1
Hola, necesito ayuda con código que recorra una página hasta el final y muestre todos los links de videos, la página requiere un login y contraseña, tiene más de 2000 posts que se van cargando de 5 en 5, conforme se va desplazando hacia abajo, la mayoría de las veces se queda parado cargando posts, si se cargaran todos ellos, podría ver el código fuente y extraer los enlaces pero nunca consigo que se carguen todos, agradezco toda la ayuda.
Responder
#2
Hola, bienvenido.

¿Cuál es la página en cuestión y cuál es el código que estás usando hasta el momento? ¿Dónde está el problema específicamente?

Si aún no tienes escrito nada, creo que podrías empezar por acá: https://micro.recursospython.com/recurso...a-web.html.

Saludos
¡No te pierdas nuestro curso oficial en Udemy para aprender Python, bases de datos SQL, orientación a objetos, tkinter y mucho más!

También ofrecemos consultoría profesional de desarrollo en Python para personas y empresas.
Responder
#3
He estado viendo videos de iniciación a Python, concretamente los que abren una página completamente, lo conseguí pero se me cerraba enseguida, aparecía un error de Warningdeprecated, copié el código que se suponía que se desplazaba al final de la página pero esto no lo hacía, la página es un perfil de fansmine.com que requiere suscripción, creo que es problema de la página que tarda mucho en cargar los posts y aveces ni termina de cargarlos.

El código de la página que has puesto, con la página que quiero sacar los enlaces muestra el siguiente error:

Código:
Traceback (most recent call last):
  File "c:\Users\Miguel\Documents\Python\1.py", line 4, in <module>
    r = urlopen("https://fansmine.com/RussianSpy/")
        ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 216, in urlopen      
    return opener.open(url, data, timeout)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 525, in open
    response = meth(req, response)
               ^^^^^^^^^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 634, in http_response
    response = self.parent.error(
               ^^^^^^^^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 563, in error        
    return self._call_chain(*args)
           ^^^^^^^^^^^^^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 496, in _call_chain  
    result = func(*args)
             ^^^^^^^^^^^
  File "C:\Users\Miguel\AppData\Local\Programs\Python\Python311\Lib\urllib\request.py", line 643, in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden
Responder
#4
Ese error significa que no tenés permisos para ver la página, lo cual tiene lógica teniendo en cuenta que está protegido por un login. Deberías hacer un login a través de Python antes de visitar la página de la cual querés extraer los links.
¡No te pierdas nuestro curso oficial en Udemy para aprender Python, bases de datos SQL, orientación a objetos, tkinter y mucho más!

También ofrecemos consultoría profesional de desarrollo en Python para personas y empresas.
Responder
#5
Me podrías poner el código que falta o donde puedo cogerlo y adaptarlo? gracias.
Responder
#6
No conozco el sitio y tampoco has indicado cuál es la dirección de URL completa, a la cual de cualquier modo tampoco tendría acceso, tratándose de un perfil privado. No creo que pueda ayudarte mucho más.
¡No te pierdas nuestro curso oficial en Udemy para aprender Python, bases de datos SQL, orientación a objetos, tkinter y mucho más!

También ofrecemos consultoría profesional de desarrollo en Python para personas y empresas.
Responder


Salto de foro:


Usuarios navegando en este tema: 1 invitado(s)