C#并行编程之PLINQ(并行LINQ)

更新时间：2022年05月09日 14:37:08 作者：springsnow

这篇文章介绍了C#并行编程之PLINQ(并行LINQ)，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

用于对内存中的数据做并行运算，也就是说其只支持 LINQ to Object 的并行运算

一、AsParallel(并行化）

就是在集合后加个AsParallel()。

例如：

var numbers = Enumerable.Range(0, 100);
var result = numbers.AsParallel().AsOrdered().Where(i => i % 2 == 0);
foreach (var i in result)
Console.WriteLine(i);

下面我们模拟给ConcurrentDictionary灌入1500w条记录，看看串行和并行效率上的差异，注意我的老爷机是2个硬件线程。

static void Main(string[] args)
{
    var dic = LoadData();

    Stopwatch watch = new Stopwatch();

    watch.Start();

    //串行执行
    var query1 = (from n in dic.Values
                  where n.Age > 20 && n.Age < 25
                  select n).ToList();

    watch.Stop();

    Console.WriteLine("串行计算耗费时间：{0}", watch.ElapsedMilliseconds);

    watch.Restart();

    var query2 = (from n in dic.Values.AsParallel()
                  where n.Age > 20 && n.Age < 25
                  select n).ToList();

    watch.Stop();

    Console.WriteLine("并行计算耗费时间：{0}", watch.ElapsedMilliseconds);

    Console.Read();
}

public static ConcurrentDictionary<int, Student> LoadData()
{
    ConcurrentDictionary<int, Student> dic = new ConcurrentDictionary<int, Student>();

    //预加载1500w条记录
    Parallel.For(0, 15000000, (i) =>
    {
        var single = new Student()
        {
            ID = i,
            Name = "hxc" + i,
            Age = i % 151,
            CreateTime = DateTime.Now.AddSeconds(i)
        };
        dic.TryAdd(i, single);
    });

    return dic;
}

public class Student
{
    public int ID { get; set; }

    public string Name { get; set; }

    public int Age { get; set; }

    public DateTime CreateTime { get; set; }
}

orderby,sum(),average()等等这些聚合函数都是实现了并行化。

二、指定并行度

这个我在前面文章也说过，为了不让并行计算占用全部的硬件线程，或许可能要留一个线程做其他事情。

var query2 = (from n in dic.Values.AsParallel().WithDegreeOfParallelism(Environment.ProcessorCount - 1)
where n.Age > 20 && n.Age < 25
    orderby n.CreateTime descending
    select n).ToList();

三、了解ParallelEnumerable类

首先这个类是Enumerable的并行版本，提供了很多用于查询实现的一组方法，下图为ParallelEnumerable类的方法，记住他们都是并行的。

ConcurrentBag<int> bag = new ConcurrentBag<int>();
 var list = ParallelEnumerable.Range
(0, 10000);
 list.ForAll((i) =>
 {
     bag.Add(i);
 });

 Console.WriteLine("bag集合中元素个数有:{0}", bag.Count);
 Console.WriteLine("list集合中元素个数总和为:{0}", list.Sum());
 Console.WriteLine("list集合中元素最大值为:{0}", list.Max());
 Console.WriteLine("list集合中元素第一个元素为:{0}", list.FirstOrDefault());

四、plinq实现MapReduce算法

mapReduce是一个非常流行的编程模型，用于大规模数据集的并行计算，非常的牛X啊，记得mongodb中就用到了这个玩意。

map：也就是“映射”操作，可以为每一个数据项建立一个键值对，映射完后会形成一个键值对的集合。
reduce：“化简”操作，我们对这些巨大的“键值对集合“进行分组，统计等等。

下面我举个例子，用Mapreduce来实现一个对age的分组统计。

static void Main(string[] args)
{
    List<Student> list = new List<Student>()
    {
        new Student(){ ID=1, Name="jack", Age=20},
        new Student(){ ID=1, Name="mary", Age=25},
        new Student(){ ID=1, Name="joe", Age=29},
        new Student(){ ID=1, Name="Aaron", Age=25},
    };

    //这里我们会对age建立一组键值对
    var map = list.AsParallel().ToLookup(i => i.Age, count => 1);

    //化简统计
    var reduce = from IGrouping<int, int> singleMap
                 in map.AsParallel()
                 select new
                 {
                     Age = singleMap.Key,
                     Count = singleMap.Count()
                 };

    ///最后遍历
    reduce.ForAll(i =>
    {
        Console.WriteLine("当前Age={0}的人数有:{1}人", i.Age, i.Count);
    });
}

public class Student
{
    public int ID { get; set; }

    public string Name { get; set; }

    public int Age { get; set; }

    public DateTime CreateTime { get; set; }
}

考虑一个简单的例子，现有一个容量为1000000的单词集，需要我们以降序列出其中出现次数超过100000的单词（和其次数）。Map过程，使用PLINQ将集合按单词分组，这里使用了Lookup容器接口，它与Dictionary类似，但是提供的是键-值集映射；Reduce过程，使用PLINQ归约查询即可。

某一次运行结果如下：

Word: you, Count: 142416
Word: van, Count: 115816
Word: next, Count: 110228

到此这篇关于C#并行编程之PLINQ(并行LINQ)的文章就介绍到这了。希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

.Net WInform开发笔记(三)谈谈自制控件(自定义控件)
自定义控件的出现有利于用户更好的实现自己的想法，可以封装一些常用的方法，属性等等，本文详细介绍一下自定义控件的实现，感兴趣的朋友可以了解下
2013-01-01
基于C#编写获取硬件信息的工具类
这篇文章主要为大家详细介绍了如何利用C#编写一个获取硬件信息的简单工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起了解一下
2023-11-11
C#获取进程的主窗口句柄的实现方法
C#获取进程的主窗口句柄的实现方法，需要的朋友可以参考一下
2013-04-04
如何在c#中使用opencv函数库
这篇文章主要介绍了如何在c#中使用opencv，对图像匹配处理感兴趣的同学可以参考下
2021-04-04
C#基础知识之new关键字介绍
在 C# 中，new 关键字可用作运算符、修饰符或约束，本文主要介绍这三种用法。
2016-04-04
c#中判断字符串是不是数字或字母的方法
这篇文章介绍了C#判断字符串是否数字或字母的实例，有需要的朋友可以参考一下
2013-06-06
c#泛型序列化对象为字节数组的示例
这篇文章主要介绍了c#泛型序列化对象为字节数组的示例,需要的朋友可以参考下
2014-04-04
C#执行存储过程并将结果填充到GridView的方法
这篇文章主要介绍了C#执行存储过程并将结果填充到GridView的方法,结合实例形式分析了C#存储过程操作及GridView控件相关操作技巧,需要的朋友可以参考下
2017-02-02
C#中StringBuilder类的使用总结
本篇文章主要是对C#中StringBuilder类的使用方法进行了详细的总结介绍，需要的朋友可以过来参考下，希望对大家有所帮助
2014-01-01
C#匿名委托和Java匿名局部内部类使用方法示例
Java在嵌套类型这里提供的特性比较多，假设：Java的字节码只支持静态嵌套类，内部类、局部内部类和匿名局部内部类都是编译器提供的语法糖，这个假设目前没法验证（看不懂字节码），本文先来看一下C#是如何为我们提供的这种语法糖
2013-11-11