当前位置：首页 > 资讯 > 计算机/互联网 > 互联网

Mitmproxy 是怎么工作的？

时间：2019-01-23 18:47 编辑：2KB 来源：2KB.COM 阅读：413
扫一扫，手机访问

分享
扫描二维码，分享到微信打开微信
使用"扫一扫"
再点击微信界面右上角三个点标志
分享到微信朋友和朋友圈。

摘要：

Mitmproxy 英文原文：How mitmproxy works

由于我对所用的拦截工具感到厌烦，我才开始有关mitmproxy的工作。我有一个轻度抱怨的长长地列表- 它们没有足够的灵活性，没有足够的可编程性，大多数都是用java（我不喜欢的一种语言）写的，等等。不过，最严重的问题是不透明性。最好用的工具全部是闭源的和商业性的。SSL拦截是一个复杂和精细的过程，并且从某一点开始，无法精确的理解你的代理正在做什么就没办法继续运行。

下文现在是mitmproxy官方文档的一部分。它对mitmproxy的拦截过程做了详细的描述，并且或多或少是我首次启动这个项目的时候我希望所拥有的概要性文档。我以例子开始着手，开始用的最简单的非加密的显式代理，直到最复杂的交互式包含SNI的SSL加密流量的透明代理。

Explicit HTTP

配置客户端使用mitmproxy作为一个显式代理是拦截流量最简单，最可靠的办法。代理协议被编纂在 HTTP RFC, 所以客户端和服务器的行为都是被很好的定义并且通常是可靠的。一个客户端尽可能简单的与mitmproxy互动，通过直接连接到代理服务器，发出请求，看起来像这样:

GET http://example.com/index.html HTTP/1.1

这是GET代理请求-传统HTTP GET请求的一种扩展形式(包括一个schema和主机规格)，它包括了mitmproxy需要转达请求上游的所有信息。

1.客户端连接到代理服务器发出请求。
2 .Mitmproxy连接到上游服务器，简单的转发请求。

明文(显示)HTTPS

显式代理HTTPS的连接过程是完全不同的。客户端通常是这样连接到代理服务器的：

CONNECT example.com:443 HTTP/1.1

传统的代理服务器既不监视也不操纵SSL加密的数据流，那一个连接请求只是简单请求代理服务器在客户端和服务器之间假设一条管道。这里的代理服务器就像是一个催化器-它盲目在两个方向上转发数据却不关心数据的内容。加密的的 SSL数据在这条通道上传输，接下来的的请求和响应对代理服务器则是完全不透明。

mitmproxy中的MITM（中间人）

这正是mitmproxy重要的诀窍起作用的地方。 MITM正如它的名字一样代表的是中间人，即我们用来拦截并阻止这些理论上不透明的数据流的过程。基本的理念是对客户端来说伪装成服务器，而对服务器来说伪装成客户端，这样我们就处在中间位置来解码来自双方的数据流。诀窍的部分是设计了认证授权系统以准确地阻止攻击，即通过允许信任的第三方加密地签发服务器的SSL证书来验证它们是否合法。如果这个签名不匹配或者来自于不受信任的一方，安全客户端将简单地丢弃这个连接并且拒绝进行下一步工作。尽管现在的CA系统存在诸多缺点，但试图对MITM的SSL连接进行分析通常却是致命的。对这种猜谜式的分析的答案是我们自身成为一个可信任的认证授权中心。mitmproxy包含了一个完整的CA实现，它可在运行期间产生拦截认证。为了使客户端信任这样的认证，我们手工地对使用的设备注册mitmproxy为可信任的授权认证中心。

难点一：什么是远端主机名？

为了使这个想法继续向前推进，我们需要知道在拦截证书里使用的域名，客户端将验证这个证书是不是针对他正在连接的域，如果不是这种情况，就马上终止。乍一看，似乎在这个例子里上文的CONNECT请求给了我们所需要的一切，两个值都是"example.com" 。不过如果客户端如下面这样发起连接又怎样呢：

CONNECT 10.1.1.1:443 HTTP/1.1

使用IP地址是非常合理的，因为它给我们足够的信息初始化传输管道，即使它不给出远端的主机名。mitmproxy使用了一个精巧的机制最终抚平了这个缺陷-上游证书侦听。当我们一看到CONNECT请求，我们立即暂停会话的客户端，然后向服务器发起一个相同的连接。我们完成了同服务器的SSL握手，然后查看它使用的证书。现在我们使用上游SSL证书里的常用名来产生一个对客户端仿制的证书。瞧，即使客户端从没有指明的情况下，我们也可以向客户端显示正确的主机名。

难点二：使用者备用名

进入下一个难点。事实上，有时候证书里的常用名不是客户端正在连接的主机名。这是因为SSL证书里有一个可选的使用者备用名域，它允许指定任意数量的备用域名。即使域名不匹配证书常用名称时，如果期望的域名匹配这些域名中的任何一个，客户端将会继续下一步工作。这个答案简单：当从上游证书提取常用名(CN)时，我们也提取使用者备用名(SAN)，并把他们增加到已经产生的仿制的证书里。 难点三：服务器名字指示

常用的SSL大的限制之一就是每个证书需要有它自己的IP地址。这意味着你不能做具有独立证书的多个域共享同一个IP地址的虚拟主机。在这个快速缩减IPv4地址池的世界里，这是个问题，不过我们提出了对SSL和TLS协议的服务器名字指示扩展的解决方案，这允许客户端在SSL握手开始的时候指明远端服务器名字，然后就让服务器选择正确的证书以完成这个过程。

服务器名字指示（SNI）破坏了上游证书侦听的过程，因为当我们不使用服务器名字指示(SNI)而连接的时候，我们获得的提供服务的默认证书，这也许与客户端期望的证书没有任何关系。解决的方法是对客户端的连接过程继续技巧性的复杂化。客户端连接后，我们允许SSL握手继续，直到服务器名字指示(SNI)传送给我们。现在我们暂停这个会话，然后使用正确的服务器名字指示(SNI)启动上游连接，接着服务器给我们提供一个正确的上游证书，我们从这个证书里可以提取期望的常用名(CN)和服务器备用名(SAN)。

这儿还有另一种方法。由于mitmproxy使用的SSL库的限制，我们检测不到连接发送服务器名字指示(SNI)请求对上游认证侦听来说太迟了这种情况。因此，实践中我们使用了常用的SSL连接来侦听上游非服务器名字指示(SNI)的认证，接着如果客户端发送了一个服务器名字指示(SNI)通知的话，就释放这个连接。如果你使用包侦听器看到你的数据流的话，那么当发送服务器名字指示的(SNI)请求时候你将能看到两个到服务器的连接。其中的一个在SSL握手之后立刻关闭。很幸运，实践中这几乎从来都不是问题。

总结

让我们把前面几段总结为完整的显式代理的HTTPS流。

1.客户端发起一个到mitmproxy的连接，并且提交了HTTP CONNECT请求。
2.mitmproxy以200连接已经建立响应，好像已经建立了CONNECT通信管道。
3.客户端确信它正在和远端服务器会话，然后启动SSL连接。SSL连接使用服务器名字指示(SNI)指明它正在连接的主机名。
4.mitmproxy连接服务器，然后使用客户端指明的服务器名字指示的主机名建立SSL连接。
5.服务器以匹配的SSL证书响应，这个SSL证书里包含生成的拦截证书所必须的通用名(CN)和服务器备用名(SAN)。
6.mitmproxy生成拦截证书，然后继续进行在第３步暂停的客户端SSL握手。
7.客户端通过已经建立的SSL连接发送请求。
8.mitmproxy通过第４步建立的SSL连接传递这个请求给服务器。 透明HTTP 代理
使用透明代理的时候，要重新定向HTTP/HTTPS连接到处于网络层的代理，但客户端不需要任何配置。在你不更改客户端行为的情况下使得透明代理成为最佳选择-无法看见代理的安卓应用是常见的例子。

为了获得透明代理，我们必须介绍两个额外的组件。第一个是重定向机制，它透明地重新路由目的地在互联网上的服务器的TCP连接到正在侦听的代理服务器。这通常在与代理服务器相同的主机上采用防火墙的形式实现-Linux的iptables或者OSX的pf。一旦客户端初始化了连接，它将发起常见的HTTP请求，可能看起来如下：

GET /index.html HTTP/1.1

注意，这儿的请求与显式代理的请求是不同的，因为它省略了协议和主机名。那么我们是怎样知道向前转发请求的是哪个上游主机的呢？执行重定向的路由机制追踪着我们的原始目的地。每个路由机制都用不同方式显示这些数据，因此这儿介绍透明代理工作所需要的第二个组件：主机模块。它知道如何从路由里获取原始的目的地址。在mitmproxy里，采用了内置模块集的方式来明确怎样和每个平台重定向机制会话。一旦我们有了这个信息，处理过程将非常明了。

1.客户端发起到服务器的连接。
2.路由器将重定向这个连接到mitmproxy，mitmproxy通常侦听在同一个主机的本地端口上。mitmproxy然后查询路由机制以确定原始目的地址。
3.现在，我们仅仅读客户端的请求......
4....然后向前转发请求到上游主机

本文中的所有译文仅用于学习和交流目的，转载请务必注明文章译者、出处、和本文链接。 2KB翻译工作遵照 CC 协议，如果我们的工作有侵犯到您的权益，请及时联系我们。

2KB项目（www.2kb.com，源码交易平台）,提供担保交易、源码交易、虚拟商品、在家创业、在线创业、任务交易、网站设计、软件设计、网络兼职、站长交易、域名交易、链接买卖、网站交易、广告买卖、站长培训、建站美工等服务

全部评论(0)

上一篇：写给精明 Java 开辟者的顶级测试技能
下一篇：使用 Countly 来分析 Apple Watch 统计数据

最新发布的资讯信息
【计算机/互联网|】Nginx出现502错误(2020-01-20 21:02)
【计算机/互联网|】网站运营全智能软手V0.1版发布(2020-01-20 12:16)
【计算机/互联网|】淘宝这是怎么了？(2020-01-19 19:15)
【行业动态|】谷歌关闭小米智能摄像头，因为窃听器显示了陌生人家中的照片(2020-01-15 09:42)
【行业动态|】据报道谷歌新闻终止了数字杂志，退还主动订阅(2020-01-15 09:39)
【行业动态|】康佳将OLED电视带到美国与LG和索尼竞争(2020-01-15 09:38)
【行业动态|】2020年最佳AV接收机(2020-01-15 09:35)
【行业动态|】2020年最佳流媒体设备：Roku，Apple TV，Firebar，Chromecast等(2020-01-15 09:31)
【行业动态|】CES 2020预览：更多的流媒体服务和订阅即将到来(2020-01-08 21:41)
【行业动态|】从埃隆·马斯克到杰夫·贝佐斯，这30位人物定义了2010年代(2020-01-01 15:14)

商品推荐
友价商城交易源代码插件-自动生成sitemap插件
￥30.00
百度链接主动推送和熊掌号推送通用版 - 支持任意网站无需插件
￥15.00
2KB网站地图助手/一键生成Sitemap/过滤全站死链/生成全站外链
￥10.00
网站SEO优化分析/死链检测/外链检测/Sitemap生成/抓取分析
￥100.00
YSZI.COM - 新闻自媒体导航平台项目众筹
￥1000.00

资讯排行榜
更多>>