开箱即用-移动网络IPv6浓度检测工具-六虎

一、布景

关于加快推进互联网协议第六版（IPv6）规模部署和运用作业的通知

到2023年底，基本建成先进自主的 IPv6 技术、产业、设施、运用和安全系统，形成市场驱动、协同互促的良性开展格局。IPv6 活跃用户数到达7亿，物联网 IPv6 衔接数到达2亿。移动网络IPv6流量占比到达50% ，城域网IPv6流量占比到达15%。

称号解说

移动网络 IPv6 流量占比（浓度） =（4G 网络IPv6 流量+5G网络IPv6 流量）/（4G 网络总流量+5G 网络总流量）。

测验目标： 互联网运用（APP）IPv6 浓度指在移动终端上运用APP10 分钟内所经过 IPv6 协议承载的网络流量占全部网络流量 – 5 – 的比例，取三次测验的平均值。

IPv4地址： 运用32位正整数表明，需求4字节存储，可以供给约2^32≈4.3×10^9个地址；为了便利回忆选用了点分十进制的符号办法，如114.114.114.114便是一个IPv4地址。

IPv6地址： 选用128位正整数表明，需求16字节存储，可以供给约2^128≈3.4×10^38个地址；选用了冒号十六进制法来表明IPv6地址，它将每个16位的值用十六进制表明，各值之间用冒号分隔，如2001:0DB8:0000:0023:0008:0800:200C:417A便是一个IPv6地址

二、效果展示

这儿以 App内 IPv6 浓度检测为例，进步移动网络的 IPv6 浓度，要害是找到App内恳求的接口域名中还有哪些还没有支撑 IPv6。

该东西的要害点是经过获取抓包数据，经过对抓包数据剖析聚合，然后找到走 IPv4 的域名列表，经过该东西生成的终究产物如下：

页面	IPv6流量占比	IPv4域名列表
京喜特价	99.87%	域名：gold.jd.com，数据巨细：1.52kb，占比：0.01% 域名：httpfereport.jd.com，数据巨细：0.10kb，占比：0.00% 域名：fd.3.cn，数据巨细：-0.00kb，占比：-0.00% 域名：mcard.jd.com，数据巨细：6.80kb，占比：0.04% 域名：gia.jd.com，数据巨细：0.98kb，占比：0.01% 域名：blackhole-m.m.jd.com，数据巨细：1.16kb，占比：0.01% 域名：lbsgwh5.m.jd.com，数据巨细：0.09kb，占比：0.00% 域名：cactus.jd.com，数据巨细：3.04kb，占比：0.02% 域名：sp-desk.jd.com，数据巨细：1.14kb，占比：0.01% 域名：sh.jd.com，数据巨细：-0.05kb，占比：-0.00% 域名：im-x.jd.com，数据巨细：0.01kb，占比：0.00% 域名：blackhole.m.jd.com，数据巨细：1.01kb，占比：0.01% 域名：sdkfp.jd.com，数据巨细：3.15kb，占比：0.02% 域名：mllog.jd.com，数据巨细：0.22kb，占比：0.00% 域名：aks.jdpay.com，数据巨细：0.02kb，占比：0.00% 域名：gs-loc-cn.apple.com，数据巨细：0.08kb，占比：0.00% 域名：ccc-x.jd.com，数据巨细：0.05kb，占比：0.00% 域名：storage.jd.com，数据巨细：-0.00kb，占比：-0.00% 域名：shop-license.jd.com，数据巨细：1.39kb，占比：0.01% 域名：rjsb-token-m.jd.com，数据巨细：0.52kb，占比：0.00% 域名：daily-redpacket.jd.com，数据巨细：1.28kb，占比：0.01%

有了这一份数据，整个App 的 IPv6 的流量占比及整改方向一望而知。

三、自检东西运用

这儿以京喜特价 App为例来实践演习。

京喜特价（原京东特价版）是京东旗下满足群众消费需求的特价购物平台，以“省出新生活”为价值主张，为百姓供给质优价低的商品，让大家享用实惠购物、挣钱趣味的一起也体验到京东品质服务。

3.1、环境准备

先保障客户端支撑 IPv6 地址，这样才有或许对等衔接后台的 IPv6 地址

最差的情况下是：有些公司或许没有 Wi-Fi 支撑 IPv6 环境，需求运用 5G 网络进行检测。

硬件要求：

需求准备两台手机（ iPhoneA 支撑4/5G网络、iPhoneB 装置好检测的App）、一台 Mac电脑

软件要求：

Mac电脑装置 whistle 抓包环境（其他抓包环境类似）

3.1.1、IPv6 网络检测

iPhoneA 在手机浏览器打开 test-ipv6.com 后，会提示你当时网络是否支撑 IPv6 地址，如果一起支撑 IPv4/6，正常通讯会优先运用 IPv6，如下图：

3.1.2、测验设备支撑 IPv6

iPhoneA 运用 5G 流量敞开热门，Mac 电脑和 iPhoneB 都衔接到该热门，而且 iPhoneB 代理恳求到 Mac 电脑上：

3.1.3、并保证 Mac 电脑和 iPhoneB 都支撑 IPv6 环境，Mac 电脑上需求在网络配置 IPv6 为自动：

然后在 Mac 电脑进行测验是否现已支撑：

3.2、数据收集及处理

装有 App 的设备 iPhoneB 支撑 IPv6 网络环境，具有抓包环境的 Mac电脑就绪后，接下来便是对数据的收集作业。

3.2.1、出产数据

运用 iPhoneB 对目标App进行各种页面进行测验，这儿最好是每一个页面及涉及到网络恳求的地方都要验证一下，保证数据相对完善，然后导出一切的抓包数据，命名为：native.har

3.2.2、数据整合

# 遍历并剖析.har文件
# 遍历当时目录下的一切.har文件（HTTP归档文件，用于记录web浏览器和网站之间的交互）。
# 对每个.har文件进行解析，提取出每个恳求的URL、呼应状况、传输巨细、服务器IP地址等信息。
# 对服务器IP地址进行检查，判别其是IPv4仍是IPv6，并计算IPv6数据的巨细和总数据巨细的比例。
# 对于IPv4的恳求，提取出其域名，并计算每个域名的数据巨细。
# 将每个文件的页面标题、IPv6数据占比、未支撑IPv6的域名信息等数据保存下来。
# 最终，将一切文件的这些数据导出为一个Excel文件。
# 脚本运用办法：
# python3 analysis_ipv6.py --d '/Users/denglibing/Desktop/京喜特价H5页面IPv6验证/priorityPage'
# 或者
# python3 analysis_ipv6.py --directory '/Users/denglibing/Desktop/京喜特价H5页面IPv6验证/priorityPage'
# 生成的数据在传入的途径中，output.xlsx
import argparse
import json
import os
import glob
import ipaddress
# 获取url的domain
from urllib.parse import urlparse
# 导出表格数据
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import Alignment
# IPv6占比基线
ipv6_baseline = 1.0
def get_domain(url):
    return urlparse(url).netloc
def check_ip_address(ip):
    try:
        ip_obj = ipaddress.ip_address(ip)
        return ip_obj.version == 6
    except ValueError:
        print("无效的IP地址")
        return False
def calculate_sizes(entries):
    domains = {}
    sizes = 0
    ipv6sizes = 0
    for entry in entries:
        url = entry['request']['url']
        response = entry['response']
        size = response.get('_transferSize', response.get(
            'bodySize', 0) + response.get('headersSize', 0))
        if 'serverIPAddress' in entry:
            serverIPAddress = entry['serverIPAddress']
            if check_ip_address(serverIPAddress):
                ipv6sizes += size
            else:
                domain = get_domain(url)
                domains[domain] = domains.get(domain, 0) + size
        if size > 0:
            sizes += size
    return domains, sizes, ipv6sizes
def print_results(domains, sizes, ipv6sizes):
    ipv6point = ipv6sizes / sizes * 100
    print("IPv6 数据巨细：{:.2f}kb".format(ipv6sizes / 1024))
    print("总数据巨细：{:.2f}kb".format(sizes / 1024))
    print("IPv6 数据占比：{:.2f}%".format(ipv6point))
    print("⚠️  未支撑IPv6的域名信息：")
    ipv4info = ''
    for key, value in domains.items():
        info = "域名：{}，数据巨细：{:.2f}kb，占比：{:.2f}%".format(
            key, value / 1024, value / sizes * 100)
        ipv4info += info + '\n'
        print(info)
    print("====================")
    print("")
    return ipv6point, ipv4info
def analysis_request(entries):
    domains, sizes, ipv6sizes = calculate_sizes(entries)
    ipv6point, ipv4info = print_results(domains, sizes, ipv6sizes)
    results = {}
    if ipv6sizes / sizes < ipv6_baseline:
        results['ipv6point'] = '{:.2f}%'.format(ipv6point)
        results['ipv4list'] = ipv4info
    return results
def read_jsonfile(file):
    json_data = json.load(file)
    log = json_data['log']
    pages = log.get('pages', [])
    if not pages:
        print('har无页面数据')
        page_title = "不知道页面"
    else:
        page = pages[0]
        page_title = page['title']
        print("")
        print("加载的页面：", page_title)
    entries = log.get('entries', [])
    if 'entries' in log:
        results = analysis_request(entries)
        if results:
            results['page'] = page_title
            return results
def export_excel(data):
    # 创立一个数据字典
    # data = {'Name': ['Tom', 'Nick', 'John'],'Age': [20, 21, 19]}
    # 将数据字典转换为pandas DataFrame
    df = pd.DataFrame(data)
    # 将DataFrame导出为Excel文件
    df.to_excel(output_file, index=False)
def format_excel():
    # 加载Excel文件
    wb = load_workbook(output_file)
    # 选择要修正的作业表
    ws = wb.active
    # 设置第一列的宽度为特定值
    ws.column_dimensions['A'].width = 40
    ws.column_dimensions['B'].width = 15
    ws.column_dimensions['C'].width = 80
    # 遍历一切单元格，设置其对齐办法为上下居中
    for row in ws.iter_rows():
        for cell in row:
            cell.alignment = Alignment(vertical='center', wrap_text=True)
    # 获取C列的一切单元格
    # c_column_cells = ws['C']
    # for cell in c_column_cells:
    #     # 设置其对齐办法为自动换行
    #     cell.alignment = Alignment(wrap_text=True)
    # 保存修正后的Excel文件
    wb.save(output_file)
def traverse_files(directory):
    # 指定当时目录途径
    # directory = os.getcwd()
    print(directory)
    # 指定文件格式
    file_format = '*.har'
    # 运用glob模块获取匹配的文件途径列表
    file_list = glob.glob(os.path.join(directory, file_format))
    pages = []
    ipv6points = []
    ipv4lists = []
    # 遍历文件列表
    for file_path in file_list:
        # 打开文件进行处理
        with open(file_path, 'r') as file:
            result = read_jsonfile(file)
            if result:
                pages.append(result['page'])
                ipv6points.append(result['ipv6point'])
                ipv4lists.append(result['ipv4list'])
    if pages:
        data = {
            '页面': pages,
            'IPv6占比': ipv6points,
            'IPv4域名列表': ipv4lists
        }
        export_excel(data)
        format_excel()
# 创立一个解析器
parser = argparse.ArgumentParser(description='剖析IPv6数据')
# 增加一个命令行参数
parser.add_argument('--directory', type=str, help='要剖析的文件的目录')
parser.add_argument('--d', type=str, help='要剖析的文件的目录')
# 解析命令行参数
args = parser.parse_args()
directory = os.getcwd()
if args.directory:
    directory = args.directory
elif args.d:
    directory = args.d
output_file = directory + '/output.xlsx'
# 运用命令行参数
traverse_files(directory)

下载 analysis_ipv6.py 脚本代码（下载失利请直接运用上面的源码），将上一步出产的数据 native.har 建议放在同一个目录下，本文是放在 Desktop/IPv6Data 中：

✗ tree -L 2
.
├── analysis_ipv6.py
├── other
│  ├── native.har

3.2.3、数据剖析

在终端履行如下命令，即可得到每一个页面 IPv6 的数据量及占比，未支撑 IPv6 的域名数据：

✗ python3 analysis_ipv6.py --d /Users/denglibing/Desktop/IPv6Data/other
/Users/denglibing/Desktop/IPv6Data/other
har无页面数据
IPv6 数据巨细：17130.18kb
总数据巨细：17152.94kb
IPv6 数据占比：99.87%
⚠️  未支撑IPv6的域名信息：
域名：gold.jd.com，数据巨细：1.52kb，占比：0.01%
域名：httpfereport.jd.com，数据巨细：0.10kb，占比：0.00%
域名：fd.3.cn，数据巨细：-0.00kb，占比：-0.00%
域名：mcard.jd.com，数据巨细：6.80kb，占比：0.04%
域名：gia.jd.com，数据巨细：0.98kb，占比：0.01%
域名：blackhole-m.m.jd.com，数据巨细：1.16kb，占比：0.01%
域名：lbsgwh5.m.jd.com，数据巨细：0.09kb，占比：0.00%
域名：cactus.jd.com，数据巨细：3.04kb，占比：0.02%
域名：sp-desk.jd.com，数据巨细：1.14kb，占比：0.01%
域名：sh.jd.com，数据巨细：-0.05kb，占比：-0.00%
域名：im-x.jd.com，数据巨细：0.01kb，占比：0.00%
域名：blackhole.m.jd.com，数据巨细：1.01kb，占比：0.01%
域名：sdkfp.jd.com，数据巨细：3.15kb，占比：0.02%
域名：mllog.jd.com，数据巨细：0.22kb，占比：0.00%
域名：aks.jdpay.com，数据巨细：0.02kb，占比：0.00%
域名：gs-loc-cn.apple.com，数据巨细：0.08kb，占比：0.00%
域名：ccc-x.jd.com，数据巨细：0.05kb，占比：0.00%
域名：storage.jd.com，数据巨细：-0.00kb，占比：-0.00%
域名：shop-license.jd.com，数据巨细：1.39kb，占比：0.01%
域名：rjsb-token-m.jd.com，数据巨细：0.52kb，占比：0.00%
域名：daily-redpacket.jd.com，数据巨细：1.28kb，占比：0.01%
====================

一起会在 native.har 同一级目录下自动生成表格数据（目录下的 output.xlsx 文件），便利跟进哪些域名还未支撑IPv6

✗ tree -L 2
.
├── analysis_ipv6.py
├── other
│  ├── native.har
│  ├── output.xlsx

页面	IPv6占比	IPv4域名列表
不知道页面	99.87%	域名：gold.jd.com，数据巨细：1.52kb，占比：0.01% … …

四、其他检测办法

4.1、手机装置抓包软件

推荐在 App Store 搜索【蜻蜓抓包】，根据【蜻蜓抓包】引导装置对应的证书后，敞开抓包，然后打开 h5 页面，这儿以【特价团】页面举例阐明：

该页面中 h5speed.m.jd.com（120.52.148.150即为 IPv4 地址，现在现已支撑 IPv6 ）未支撑 IPv6，而 uranus.jd.com (2408:xxxx) 已支撑。

阐明不仅当时页面域名或许不支撑 IPv6 ，页面内部的一些恳求不支撑 IPv6 的域名也需求逐个找出来，然后在公司内部找到负责人推进支撑。

该办法优点是简单快速验证有限数量的域名是否支撑，缺点在于无法计算整个页面或者整个App的数据，然后有效持续跟进。

当然也可以经过导出 har 文件，然后经过上面的东西剖析，得到的数据是共同的。

4.2、Safari调试h5页面剖析

前提条件是需求在 iPhone 上装置 debug 包。

这儿以【京喜特价主页】入口去【特价团】页面举例阐明：

4.2.1、敞开调试模式

iPhone 装置 debug 包后，经过 Mac 上 Safri 敞开网页检测器（调试模式）：

4.2.2、页面测验收集数据

在【特价团】页面进行浏览5分钟左右，在网页检测器中选择导出命名 pro.jingxi.com-tjt.har 文件：

4.2.3、数据剖析

将 pro.jingxi.com-tjt.har 文件和如下脚本在同一个目录下，然后终端履行脚本会得到下面的数据：

➜  tree -L 2
.
├── analysis_ipv6.py
└── priorityPage
   ├── pro.jingxi.com-tjt.har

加载的页面： https://pro.jingxi.com/jx/active/2maPuB2FfzqTEmzuebGqrZsjfhLw/index.html?babelChannel=ttt1&un_area=19_1607_4773_62130&sid=fc1430bfb1f06f42118dbf15f94a5adw
IPv6 数据巨细：2261.62kb
总数据巨细：2262.93kb
IPv6 数据占比：99.94%
⚠️  未支撑IPv6的域名信息：
域名blackhole-m.m.jd.com：数据巨细：0.43kb
域名blackhole.m.jd.com：数据巨细：0.43kb
域名rjsb-token-m.jd.com：数据巨细：0.45kb
====================

而且自动导出 IPv6 浓度低于 90%（脚本中 ipv6_baseline 可以自己控制阈值） 的页面，还有哪些域名走 IPv4 地址的表格（如上表）。

该办法优点是可以聚合计算某一个 h5 页面维度的数据，供给当时 IPv6 的流量占比及整改方向，缺点在于依赖 debug 包环境及对东西的依赖，当然不支撑计算原生页面的数据。

五、参考资料

占比首破50%！我国移动网络IPv6流量超越IPv4流量

IPv6 改造相关目标和测验办法阐明

IPv6与IPv4对比学习

iOS 流量监控剖析

开箱即用-移动网络IPv6浓度检测工具

一、布景

称号解说

二、效果展示

三、自检东西运用

3.1、环境准备

3.1.1、IPv6 网络检测

3.1.2、测验设备支撑 IPv6

3.2、数据收集及处理

3.2.1、出产数据

3.2.2、数据整合

3.2.3、数据剖析

四、其他检测办法

4.1、手机装置抓包软件

4.2、Safari调试h5页面剖析

4.2.1、 敞开调试模式

4.2.2、页面测验收集数据

4.2.3、数据剖析

五、参考资料

相关文章

Godot从入门到精通基础篇 第二章 安装Godot及熟悉软件界面

GPT的前身：Improving Language Understanding by Generative Pre-Training 论文阅读

承认自己是一个普通人，不管路有多远，走就是了

栈 | stack 🧱

作者信息

4.2.1、敞开调试模式

Godot从入门到精通基础篇第二章安装Godot及熟悉软件界面