Python爬虫基础篇:Web开发中级教程如何学习?

2026-06-10 19:196阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计371个文字,预计阅读时间需要2分钟。

Python爬虫基础篇:Web开发中级教程如何学习?

1. WSGI接口+理解HTTP协议与HTML文档,我们便清晰了Web应用的实质:浏览器发送HTTP请求;服务器接收请求,生成HTML文档;服务器将HTML文档作为HTTP响应的Body发送。

1.WSGI接口

了解了HTTP协议和HTML文档,我们其实就明白了一个Web应用的本质就是:

  • 浏览器发送一个HTTP请求;
  • 服务器收到请求,生成一个HTML文档;
  • 服务器把HTML文档作为HTTP响应的Body发送给浏览器;
  • 浏览器收到HTTP响应,从HTTP Body取出HTML文档并显示。
  • 所以,最简单的Web应用就是先把HTML用文件保存好,用一个现成的HTTP服务器软件,接收用户请求,从文件中读取HTML,返回。Apache、Nginx、Liglocalhost:8000/​​,就可以看到结果了:

    Python爬虫基础篇:Web开发中级教程如何学习?

    在命令行可以看到wsgiref打印的log信息:

    按​​Ctrl+C​​终止服务器。

    如果你觉得这个Web应用太简单了,可以稍微改造一下,从​​environ​​​里读取​​PATH_INFO​​,这样可以显示更加动态的内容:

    # hello.py

    def application(environ, start_response):
    start_response('200 OK', [('Content-Type', 'text/html')])
    body = 'Hello, %s!' % (environ['PATH_INFO'][1:] or 'web')
    return [body.encode('utf-8')]

    你可以在地址栏输入用户名作为URL的一部分,将返回​​Hello, xxx!​​:

    是不是有点Web App的感觉了?

    小结

    无论多么复杂的Web应用程序,入口都是一个WSGI处理函数。HTTP请求的所有输入信息都可以通过​​environ​​​获得,HTTP响应的输出都可以通过​​start_response()​​加上函数返回值作为Body。

    复杂的Web应用程序,光靠一个WSGI函数来处理还是太底层了,我们需要在WSGI之上再抽象出Web框架,进一步简化Web开发。

    本文共计371个文字,预计阅读时间需要2分钟。

    Python爬虫基础篇:Web开发中级教程如何学习?

    1. WSGI接口+理解HTTP协议与HTML文档,我们便清晰了Web应用的实质:浏览器发送HTTP请求;服务器接收请求,生成HTML文档;服务器将HTML文档作为HTTP响应的Body发送。

    1.WSGI接口

    了解了HTTP协议和HTML文档,我们其实就明白了一个Web应用的本质就是:

  • 浏览器发送一个HTTP请求;
  • 服务器收到请求,生成一个HTML文档;
  • 服务器把HTML文档作为HTTP响应的Body发送给浏览器;
  • 浏览器收到HTTP响应,从HTTP Body取出HTML文档并显示。
  • 所以,最简单的Web应用就是先把HTML用文件保存好,用一个现成的HTTP服务器软件,接收用户请求,从文件中读取HTML,返回。Apache、Nginx、Liglocalhost:8000/​​,就可以看到结果了:

    Python爬虫基础篇:Web开发中级教程如何学习?

    在命令行可以看到wsgiref打印的log信息:

    按​​Ctrl+C​​终止服务器。

    如果你觉得这个Web应用太简单了,可以稍微改造一下,从​​environ​​​里读取​​PATH_INFO​​,这样可以显示更加动态的内容:

    # hello.py

    def application(environ, start_response):
    start_response('200 OK', [('Content-Type', 'text/html')])
    body = 'Hello, %s!' % (environ['PATH_INFO'][1:] or 'web')
    return [body.encode('utf-8')]

    你可以在地址栏输入用户名作为URL的一部分,将返回​​Hello, xxx!​​:

    是不是有点Web App的感觉了?

    小结

    无论多么复杂的Web应用程序,入口都是一个WSGI处理函数。HTTP请求的所有输入信息都可以通过​​environ​​​获得,HTTP响应的输出都可以通过​​start_response()​​加上函数返回值作为Body。

    复杂的Web应用程序,光靠一个WSGI函数来处理还是太底层了,我们需要在WSGI之上再抽象出Web框架,进一步简化Web开发。