淘宝数据包是什么意思，还有，为什么下载1个数据包如此之麻烦呢？

篮球鞋 | 电子竞技 | 梅西(lionelmessi) | 自行车运动 | 日本文化 | 机械 | 德国足球甲级联赛 | 宠物医生 | 中国足球 | 用户界面设计师 | 滑雪 | 自行车选购 | acg | 高考志愿 | 国家队 | 汽车购买 | 运动损伤 | 欧美明星 | 设计 | 大数据 | 肖战 | 中药 | 哲学 | 直播 | 3D | 电视节目 | 理科 | 欧洲 | NBA 2K | 拜仁慕尼黑足球俱乐部 | ps4 | 捷安特 | 大学专业 | 巴塞罗那足球俱乐部 | 香港购物 | 玄幻小说 | 跑鞋 | pmp | 欧洲冠军联赛 | 土拨鼠 | aj1 | 牙齿 | 尤文图斯 | 女同性恋 | 天气 | 口臭 | 足球鞋 | 户外运动 | 少帅 | 亲子鉴定 | 配音 | 角色扮演 | 手机游戏 | 旅游线路 | 郭德纲 | 旅游推荐 | 梦想改造家 | 中学 | 北京国安 | ISIS（伊斯兰国） | 一级方程式赛车（f1） | iPhone | 拼多多 | 户外 | 罗兰 | 中国 | 电源 | 金蝶 | 百度知道 | 用户界面设计 | 女排 | 城市 | 电脑 | QQ音乐 | 复仇者联盟（电影） | 室内设计 | 政府 | 人生 | 三国杀 | 韩国旅游 | 微博 | 有机化学 | 我的世界（minecraft） | 鉴定 | 汽车维修 | 戚继光 | 古汉语 | akb48 | 科幻小说 | 建筑设计 | 梵蒂冈 | 张帅 | 完美世界（游戏） | 电吉他 | 北京 | 眼镜 | 昆山 | 美容护肤 | 足球规则 | 多肉植物 | 荷兰 | macos | 昌平区 | 对联 | 曼彻斯特联 | 南京 | 实况足球（游戏） | 鹿晗 | 新闻 | 西藏大学 | 貂蝉 | 湖北 | 网易 | 借记卡 | 剧场版 | 安踏体育 | 网球王子 | 住宅风水 | 汉语 | 广播体操 | 营销策划 | 用户界面 | 武侠小说 | 汽车改装 | 张璐 | 高三 | 海军工程大学 | 诗歌 | 富平县 | 盗墓笔记（小说） | 高速公路 | 青年旅舍 | 离婚 | 相声演员 | 阿迪达斯(adidas) | 中国足球协会超级联赛（csl） | 烹饪学校 | 婚纱照 | 发烧 | 流星花园 | 动车 | 赚钱 | 爱奇艺 | 铜陵市 | 澳大利亚 | 头发 | 环境保护 | 跑步爱好者 | 后宫·甄嬛传（书籍） | 书法 | #全民答题# | 阿迪达斯 | 外星人 | 象棋 | 牛皮癣 | 动画电影 | 眼睛 | 平面设计 | 运动会 | adidas阿迪达斯 | 诸葛亮 | 云南旅游 | 巴黎 | 少数民族 | 云南 | 小品 | 跑步鞋 | 性价比 | 减脂 | 巴西 | 葡萄酒 | 非洲 | 考研 | 美容 | 张继科 | 挖掘机 | 红酒 | 淘宝网 | 战斗机 | 郭富城 | 曼彻斯特联（Manchester United） | 音乐剧 | 年会 | 易烊千玺 | 骨折 | 传统武术 | 模特 | 平板电脑 | 家用电器 | 华为手机 | 双眼皮手术 | 钢笔 | 娱乐圈 | 游泳馆 | 腾讯产品 | 法国足球甲级联赛 | 趣味 | 身高 | 日语歌曲 | 支付宝 |

你的位置：网站首页 >> 频道首页 >>资源共享 >>淘宝数据包是什么意思，还有，为什么下载1个数据包如此之麻烦呢？

淘宝数据包是什么意思，还有，为什么下载1个数据包如此之麻烦呢？

来源：蜘蛛抓取(WebSpider) 时间：2015-11-04 17:13 标签：接收数据包数是什么

麻烦各位帮忙看看，UDP组播，发送端只发送一个数据包，我感觉接收端收到了无数个数据。
[问题点数：40分，结帖人flowaway_]
麻烦各位帮忙看看，UDP组播，发送端只发送一个数据包，我感觉接收端收到了无数个数据。
[问题点数：40分，结帖人flowaway_]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
2011年总版技术专家分年内排行榜第三2010年总版技术专家分年内排行榜第三
2012年总版技术专家分年内排行榜第五
匿名用户不能发表回复！|
每天回帖即可获得10分可用分！小技巧：
你还可以输入10000个字符
(Ctrl+Enter)
请遵守CSDN，不得违反国家法律法规。
转载文章请注明出自“CSDN（www.csdn.net）”。如是商业用途请联系原作者。为什么S4 11.17号更新一直显示在下载更新数据包都一个小时了我还有事要出去呢急啊_百度知道
为什么S4 11.17号更新一直显示在下载更新数据包都一个小时了我还有事要出去呢急啊
我有更好的答案
知识导师奖免费送 | 幸运刮刮卡等刮 | 客户端精彩奖
我也出现你这样的情况，打开设定-更多-设备更新
点击看下载了多少MB，我看了我们这次更新的数据包有700多MB，我下了4个小时才下了百分40 300MB不到！所以你一个小时估计是下载不完的！
其他类似问题
为您推荐：
数据包的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁我下载了一个数据包，可不知道怎么解压，有知道的回答一下。谢谢。_百度知道
我下载了一个数据包，可不知道怎么解压，有知道的回答一下。谢谢。
我载数据包知道解压知道答谢谢
提问者采纳
1确定安装解压缩软件推荐压
360 压缩2已经安装解压缩软件
始菜单打压或者 360 压缩找需要解压缩文件进行解压即3载压缩包需打进行解压缩
其他类似问题
为您推荐：
您可能关注的推广
数据包的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁写一个每秒接收 100 万数据包的程序究竟有多难？ - 博客 - 伯乐在线
& 写一个每秒接收 100 万数据包的程序究竟有多难？
在上周的一次非正式谈话中，我偶然听同事说：“Linux 的网络栈太慢了！你别指望每秒在每个核上传输超过 5 万的数据包”。
这让我陷入了沉思，虽然对于任意的实际应用来说，每个核 5 万的速率可能是极限了，但 Linux 的网络栈究竟可能达到多少呢？我们换一种更有趣的方式来问：
在 Linux 上，编写一个每秒接收 100 万 UDP 数据包的程序究竟有多难？
我希望，通过对这个问题的解答，我们将获得关于如何设计现代网络栈很好的一课。
首先，我们假设：
测量每秒的数据包(pps)比测量每秒字节数(Bps)更有意思。您可以通过更好的管道输送以及发送更长数据包来获取更高的Bps。而相比之下，提高pps要困难得多。
因为我们对pps感兴趣，我们的实验将使用较短的 UDP 消息。准确来说是 32 字节的 UDP 负载，这相当于以太网层的 74 字节。
在实验中，我们将使用两个物理服务器：“接收器”和“发送器”。
它们都有两个六核2 GHz的 Xeon处理器。每个服务器都启用了 24 个处理器的超线程(HT)，有 Solarflare 的 10G 多队列网卡，有 11 个接收队列配置。稍后将详细介绍。
测试程序的源代码分别是：、。
我们使用4321作为UDP数据包的端口，在开始之前，我们必须确保传输不会被iptables干扰：
receiver$ iptables -I INPUT 1 -p udp --dport 4321 -j ACCEPT
receiver$ iptables -t raw -I PREROUTING 1 -p udp --dport 4321 -j NOTRACK
为了后面测试方便，我们显式地定义IP地址：
receiver$ for i in `seq 1 20`; do
ip addr add 192.168.254.$i/24 dev eth2;
sender$ ip addr add 192.168.254.30/24 dev eth3
简单的方法
开始我们做一些最简单的试验。通过简单地发送和接收，有多少包将会被传送？
模拟发送者的伪代码：
fd = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
fd.bind((&0.0.0.0&, 65400)) # select source port to reduce nondeterminism
fd.connect((&192.168.254.1&, 4321))
while True:
fd.sendmmsg([&x00& * 32] * 1024)
因为我们使用了常见的系统调用的send，所以效率不会很高。上下文切换到内核代价很高所以最好避免它。幸运地是，最近Linux加入了一个方便的系统调用叫sendmmsg。它允许我们在一次调用时，发送很多的数据包。那我们就一次发1024个数据包。
模拟接受者的伪代码：
fd = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
fd.bind((&0.0.0.0&, 4321))
while True:
packets = [None] * 1024
fd.recvmmsg(packets, MSG_WAITFORONE)
同样地，recvmmsg 也是相对于常见的 recv 更有效的一版系统调用。
让我们试试吧：
sender$ ./udpsender 192.168.254.1:4321
receiver$ ./udpreceiver1 0.0.0.0:4321
0.352M pps
10.730MiB /
0.284M pps
8.655MiB /
0.262M pps
7.991MiB /
0.199M pps
6.081MiB /
0.195M pps
5.956MiB /
0.199M pps
6.060MiB /
0.200M pps
6.097MiB /
0.197M pps
6.021MiB /
测试发现，运用最简单的方式可以实现 197k &#k pps。看起来还不错嘛，但不幸的是，很不稳定啊，这是因为内核在核之间交换我们的程序，那我们把进程附在 CPU 上将会有所帮助
sender$ taskset -c 1 ./udpsender 192.168.254.1:4321
receiver$ taskset -c 1 ./udpreceiver1 0.0.0.0:4321
0.362M pps
11.058MiB /
0.374M pps
11.411MiB /
0.369M pps
11.252MiB /
0.370M pps
11.289MiB /
0.365M pps
11.152MiB /
0.360M pps
10.971MiB /
现在内核调度器将进程运行在特定的CPU上，这提高了处理器缓存，使数据更加一致，这就是我们想要的啊！
发送更多的数据包
虽然 370k pps 对于简单的程序来说已经很不错了，但是离我们 1Mpps 的目标还有些距离。为了接收更多，首先我们必须发送更多的包。那我们用独立的两个线程发送，如何呢：
sender$ taskset -c 1,2 ./udpsender
192.168.254.1:.254.1:4321
receiver$ taskset -c 1 ./udpreceiver1 0.0.0.0:4321
0.349M pps
10.651MiB /
0.354M pps
10.815MiB /
0.354M pps
10.806MiB /
0.354M pps
10.811MiB /
接收一端的数据没有增加，ethtool –S 命令将显示数据包实际上都去哪儿了：
receiver$ watch 'sudo ethtool -S eth2 |grep rx'
rx_nodesc_drop_cnt:
rx-0.rx_packets:
rx-1.rx_packets:
rx-2.rx_packets:
rx-3.rx_packets:
rx-4.rx_packets:
rx-5.rx_packets:
rx-6.rx_packets:
rx-7.rx_packets:
rx-8.rx_packets:
rx-9.rx_packets:
rx-10.rx_packets:
通过这些统计，NIC 显示 4 号 RX 队列已经成功地传输大约 350Kpps。rx_nodesc_drop_cnt 是 Solarflare 特有的计数器，表明NIC发送到内核未能实现发送 450kpps。
有时候，这些数据包没有被发送的原因不是很清晰，然而在我们这种情境下却很清楚：4号RX队列发送数据包到4号CPU，然而4号CPU已经忙不过来了，因为它最忙也只能读350kpps。在htop中显示为：
多队列 NIC 速成课程
从历史上看，网卡拥有单个RX队列，用于硬件和内核之间传递数据包。这样的设计有一个明显的限制，就是不可能比单个CPU处理更多的数据包。
为了利用多核系统，NIC开始支持多个RX队列。这种设计很简单：每个RX队列被附到分开的CPU上，因此，把包送到所有的RX队列网卡可以利用所有的CPU。但是又产生了另一个问题：对于一个数据包，NIC怎么决定把它发送到哪一个RX队列？
用 Round-robin 的方式来平衡是不能接受的，因为这有可能导致单个连接中数据包的重排序。另一种方法是使用数据包的hash值来决定RX号码。Hash值通常由一个元组（源IP，目标IP，源port，目标port）计算而来。这确保了从一个流产生的包将最终在完全相同的RX队列，并且不可能在一个流中重排包。
在我们的例子中，hash值可能是这样的：
RX_queue_number = hash('192.168.254.30', '192.168.254.1', 6) % number_of_queues
多队列 hash 算法
Hash算法通过ethtool配置，设置如下：
receiver$ ethtool -n eth2 rx-flow-hash udp4
UDP over IPV4 flows use these fields for computing Hash flow key:
对于IPv4 UDP数据包，NIC将hash(源 IP,目标 IP)地址。即
RX_queue_number = hash('192.168.254.30', '192.168.254.1') % number_of_queues
这是相当有限的，因为它忽略了端口号。很多NIC允许自定义hash。再一次，使用ethtool我们可以选择元组(源 IP、目标 IP、源port、目标port)生成hash值。
receiver$ ethtool -N eth2 rx-flow-hash udp4 sdfn
Cannot change RX network flow hashing options: Operation not supported
不幸地是，我们的NIC不支持自定义，我们只能选用(源 IP、目的 IP) 生成hash。
NUMA性能报告
到目前为止，我们所有的数据包都流向一个RX队列，并且一个CPU。我们可以借这个机会为基准来衡量不同CPU的性能。在我们设置为接收方的主机上有两个单独的处理器，每一个都是一个不同的NUMA节点。
在我们设置中，可以将单线程接收者依附到四个CPU中的一个，四个选项如下：
另一个CPU上运行接收器，但将相同的NUMA节点作为RX队列。性能如上面我们看到的，大约是360 kpps。
将运行接收器的同一 CPU 作为RX队列，我们可以得到大约430 kpps。但这样也会有很高的不稳定性，如果NIC被数据包所淹没，性能将下降到零。
当接收器运行在HT对应的处理RX队列的CPU之上，性能是通常的一半，大约在200kpps左右。
接收器在一个不同的NUMA节点而不是RX队列的CPU上，性能大约是330 kpps。但是数字会不太一致。
虽然运行在一个不同的NUMA节点上有10%的代价，听起来可能不算太坏，但随着规模的变大，问题只会变得更糟。在一些测试中，每个核只能发出250 kpps，在所有跨NUMA测试中，这种不稳定是很糟糕。跨NUMA节点的性能损失，在更高的吞吐量上更明显。在一次测试时，发现在一个坏掉的NUMA节点上运行接收器，性能下降有4倍。
3.多接收IP
因为我们NIC上hash算法的限制，通过RX队列分配数据包的唯一方法是利用多个IP地址。下面是如何将数据包发到不同的目的IP：
sender$ taskset -c 1,2 ./udpsender 192.168.254.1:.254.2:4321
ethtool 证实了数据包流向了不同的 RX 队列：
receiver$ watch 'sudo ethtool -S eth2 |grep rx'
rx-0.rx_packets:
rx-1.rx_packets:
rx-2.rx_packets:
rx-3.rx_packets:
rx-4.rx_packets:
rx-5.rx_packets:
rx-6.rx_packets:
rx-7.rx_packets:
rx-8.rx_packets:
rx-9.rx_packets:
rx-10.rx_packets:
接收部分：
receiver$ taskset -c 1 ./udpreceiver1 0.0.0.0:4321
0.609M pps
18.599MiB / 156.019Mb
0.657M pps
20.039MiB / 168.102Mb
0.649M pps
19.803MiB / 166.120Mb
万岁！有两个核忙于处理RX队列，第三运行应用程序时，可以达到大约650 kpps !
我们可以通过发送数据到三或四个RX队列来增加这个数值，但是很快这个应用就会有另一个瓶颈。这一次rx_nodesc_drop_cnt没有增加，但是netstat接收到了如下错误：
receiver$ watch 'netstat -s --udp'
437.0k/s packets received
0.0/s packets to unknown port received.
386.9k/s packet receive errors
0.0/s packets sent
RcvbufErrors:
SndbufErrors: 0
InCsumErrors: 0
这意味着虽然NIC能够将数据包发送到内核，但是内核不能将数据包发给应用程序。在我们的case中，只能提供440 kpps，其余的390 kpps + 123 kpps的下降是由于应用程序接收它们不够快。
4.多线程接收
我们需要扩展接收者应用程序。最简单的方式是利用多线程接收，但是不管用：
sender$ taskset -c 1,2 ./udpsender 192.168.254.1:.254.2:4321
receiver$ taskset -c 1,2 ./udpreceiver1 0.0.0.0:4321 2
0.495M pps
15.108MiB / 126.733Mb
0.480M pps
14.636MiB / 122.775Mb
0.461M pps
14.071MiB / 118.038Mb
0.486M pps
14.820MiB / 124.322Mb
接收性能较于单个线程下降了，这是由UDP接收缓冲区那边的锁竞争导致的。由于两个线程使用相同的套接字描述符，它们花费过多的时间在UDP接收缓冲区的锁竞争。详细描述了这一问题。
看来使用多线程从一个描述符接收，并不是最优方案。
5. SO_REUSEPORT
幸运地是，最近有一个解决方案添加到 Linux 了 —— （flag）。当这个标志位设置在一个套接字描述符上时，Linux将允许许多进程绑定到相同的端口，事实上，任何数量的进程将允许绑定上去，负载也会均衡分布。
有了SO_REUSEPORT，每一个进程都有一个独立的socket描述符。因此每一个都会拥有一个专用的UDP接收缓冲区。这样就避免了以前遇到的竞争问题：
receiver$ taskset -c 1,2,3,4 ./udpreceiver1 0.0.0.0:
1.114M pps
34.007MiB / 285.271Mb
1.147M pps
34.990MiB / 293.518Mb
1.126M pps
34.374MiB / 288.354Mb
现在更加喜欢了，吞吐量很不错嘛！
更多的调查显示还有进一步改进的空间。即使我们开始4个接收线程，负载也会不均匀地分布：
两个进程接收了所有的工作，而另外两个根本没有数据包。这是因为hash冲突，但是这次是在SO_REUSEPORT层。
我做了一些进一步的测试，完全一致的RX队列，接收线程在单个NUMA节点可以达到1.4Mpps。在不同的NUMA节点上运行接收者会导致这个数字做多下降到1Mpps。
总之，如果你想要一个完美的性能，你需要做下面这些：
确保流量均匀分布在许多RX队列和SO_REUSEPORT进程上。在实践中，只要有大量的连接(或流动)，负载通常是分布式的。
需要有足够的CPU容量去从内核上获取数据包。
To make the things harder, both RX queues and receiver processes should be on a single NUMA node.
为了使事情更加稳定，RX队列和接收进程都应该在单个NUMA节点上。
虽然我们已经表明，在一台Linux机器上接收1Mpps在技术上是可行的，但是应用程序将不会对收到的数据包做任何实际处理——甚至连看都不看内容的流量。别太指望这样的性能，因为对于任何实际应用并没有太大用处。
关于作者：
可能感兴趣的话题
最新评论（期待您也参与评论）
关于伯乐在线博客
在这个信息爆炸的时代，人们已然被大量、快速并且简短的信息所包围。然而，我们相信：过多“快餐”式的阅读只会令人“虚胖”，缺乏实质的内涵。伯乐在线博客团队正试图以我们微薄的力量，把优秀的原创/译文分享给读者，做一个小而精的精选博客，为“快餐”添加一些“营养”元素。
新浪微博：
微信号：Jobbole
（加好友请注明来意）
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选博客文章
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2015 伯乐在线
赞助云主机

淘宝数据包是什么意思，还有，为什么下载1个数据包如此之麻烦呢？

我要回帖

更多关于接收数据包数是什么的文章

随机推荐

淘宝数据包是什么意思，还有，为什么下载1个数据包如此之麻烦呢？

我要回帖

更多关于 接收数据包数是什么 的文章

随机推荐

更多关于接收数据包数是什么的文章