【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例

    xiaoxiao2025-01-13  16

    漫游 Tox-rs,第一部分

    长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。

    Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。

    Read More

    切片索引检查导致的3倍性能下降问题一例

    作者发现下面这两片代码:

    pub fn insertion_sort(data: &mut [i32]) { for sorted in 0..data.len() { let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap(); data.swap(sorted, min); } } pub fn insertion_sort_fast(data: &mut [i32]) { unsafe { for sorted in 0..data.len() { let min = (sorted..data.len()) .min_by_key(|&i| data.get_unchecked(i)) .unwrap(); std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min)); } } }

    性能有3倍左右的差距

    insertions sort time: [551.79 us 553.24 us 555.71 us] insertions sort (fast) time: [187.75 us 188.15 us 188.84 us]

    很奇怪。于是很多人给他建议。

    换种写法,跟unsafe差不多快。

    pub fn insertion_sort(data: &mut [i32]) { for sorted in 0..data.len() { let min = data .iter() .enumerate().skip(sorted) .min_by_key(|(i, e)| *e) .unwrap() .0; data.swap(sorted, min); } }

    打开 -C opt-level=z 编译标志,按下面方式写:

    pub fn insertion_sort_fast(data: &mut [i32]) { let mut data = data; while data.len() > 1 { let (head, tail) = data.split_first_mut().unwrap(); let tailmin = tail.iter_mut().min().unwrap(); if head > tailmin { std::mem::swap(head, tailmin); } data = tail; } }

    还有一种写法:

    pub fn insertion_sort_iter(data: &mut [i32]) { for sorted in 0..data.len() { let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0; data.swap(sorted, min + sorted); } } insertions sort (fast) time: [187.05 us 187.37 us 187.84 us] insertions sort (iter) time: [186.87 us 187.30 us 188.00 us]

    跟 unsafe 差不多。

    Read More

    ccl - 据说是目前为止性能最高的并发哈希库

    ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。

    20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51 hashbrown_rwlock time: [64.199 ms 64.234 ms 64.266 ms] chashmap time: [15.190 ms 15.220 ms 15.251 ms] dhashmap_ccl time: [1.0199 ms 1.0244 ms 1.0303 ms] concache time: [126.15 ms 126.61 ms 127.03 ms] crossbeam-skiplist time: [10.648 ms 10.681 ms 10.713 ms]

    Read More Repo

    terminal-typeracer - 终端下的打字竞速游戏

    什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:

    代码在这里

    Repo

    calcify - 3D/4D 矩阵代数库

    用于物理模拟。

    Repo


    From 日报小组 @Mike

    日报订阅地址:

    独立日报订阅地址:

    Telgram Channel阿里云语雀订阅SteemitGitHub

    社区学习交流平台订阅:

    Rust.cc论坛: 支持rssRust Force: 支持rss微信公众号:Rust语言学习交流
    最新回复(0)