.NET框架中的并发HashSet <T>

我有以下class级。

class Test{ public HashSet<string> Data = new HashSet<string>(); } 

我需要从不同的线程更改字段“数据”,所以我想对我目前的线程安全实现一些意见。

 class Test{ public HashSet<string> Data = new HashSet<string>(); public void Add(string Val){ lock(Data) Data.Add(Val); } public void Remove(string Val){ lock(Data) Data.Remove(Val); } } 

有没有更好的解决scheme,直接去现场,并保护它从multithreading并发访问?

您的实施是正确的。 不幸的是,.NET Framework不提供内置的并发哈希集types。 但是,有一些解决方法。

ConcurrentDictionary(推荐)

第一个是在命名空间System.Collections.Concurrent使用类ConcurrentDictionary<TKey, TValue> 。 在这种情况下,这个值是没有意义的,所以我们可以使用一个简单的byte (内存中的1个字节)。

 private ConcurrentDictionary<string, byte> _data; 

这是推荐的选项,因为types是线程安全的,并且提供与HashSet<T>相同的优点,但key和value是不同的对象。

来源: 社交MSDN

ConcurrentBag

如果您不介意重复的条目,则可以在上一个类的相同名称空间中使用类ConcurrentBag<T>

 private ConcurrentBag<string> _data; 

自我实现

最后,就像你所做的那样,你可以使用locking或者.NET为你提供线程安全的其他方式来实现你自己的数据types。 下面是一个很好的例子: 如何在.Net中实现ConcurrentHashSet

这种解决scheme的唯一缺点是typesHashSet<T>不能正式并发访问,即使对于读取操作。

我引用了链接文章的代码(最初由Ben Mosher编写)。

 using System.Collections.Generic; using System.Threading; namespace BlahBlah.Utilities { public class ConcurrentHashSet<T> : IDisposable { private readonly ReaderWriterLockSlim _lock = new ReaderWriterLockSlim(LockRecursionPolicy.SupportsRecursion); private readonly HashSet<T> _hashSet = new HashSet<T>(); #region Implementation of ICollection<T> ...ish public bool Add(T item) { _lock.EnterWriteLock(); try { return _hashSet.Add(item); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public void Clear() { _lock.EnterWriteLock(); try { _hashSet.Clear(); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool Contains(T item) { _lock.EnterReadLock(); try { return _hashSet.Contains(item); } finally { if (_lock.IsReadLockHeld) _lock.ExitReadLock(); } } public bool Remove(T item) { _lock.EnterWriteLock(); try { return _hashSet.Remove(item); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public int Count { get { _lock.EnterReadLock(); try { return _hashSet.Count; } finally { if (_lock.IsReadLockHeld) _lock.ExitReadLock(); } } } #endregion #region Dispose public void Dispose() { Dispose(true); GC.SuppressFinalize(this); } protected virtual void Dispose(bool disposing) { if (disposing) if (_lock != null) _lock.Dispose(); } ~ConcurrentHashSet() { Dispose(false); } #endregion } } 

编辑:移动try块上的入口locking方法,因为它们可能抛出exception并执行finally块中包含的指令。

而不是包装一个ConcurrentDictionary或locking一个HashSet我创build了一个基于ConcurrentDictionary的实际ConcurrentDictionary

这个实现支持没有HashSet的set操作的每个项目的基本操作,因为它们在并发场景中的意义不大IMO:

 var concurrentHashSet = new ConcurrentHashSet<string>( new[] { "hamster", "HAMster", "bar", }, StringComparer.OrdinalIgnoreCase); concurrentHashSet.TryRemove("foo"); if (concurrentHashSet.Contains("BAR")) { Console.WriteLine(concurrentHashSet.Count); } 

输出:2

你可以从这里获取NuGet ,并在这里看到GitHub上的源代码。

由于没有人提到它,所以我会提供一个可能或可能不适合您特定目的的替代方法:

微软不变的集合

来自MS小组的博客文章背后:

同时创build和运行比以前更容易,其中一个根本问题仍然存在:可变的共享状态。 从多个线程读取通常非常容易,但是一旦状态需要更新,就会变得更加困难,特别是在需要locking的devise中。

locking的替代方法是利用不可变状态。 不可变的数据结构保证永不改变,因此可以在不同的线程之间自由地传递,而不用担心踩到别人的脚趾。

这种devise会产生一个新的问题:如何pipe理状态的变化,而不是每次都复制整个状态? 这涉及到收集时特别棘手。

这是不变的collections进来的地方。

这些集合包括ImmutableHashSet <T>和ImmutableList <T> 。

性能

由于不可变集合使用下面的树状数据结构来实现结构共享,因此它们的性能特征与可变集合不同。 与locking可变集合进行比较时,结果将取决于locking争用和访问模式。 然而,从另一篇关于不可变collections的博客文章中 ,

问:我听说不可变的collections是缓慢的。 这些有什么不同吗? 当性能或内存很重要时,我可以使用它们吗?

答:这些不可变动的collections已经被高度地调整,以在平衡内存共享的同时,为可变collections提供具有竞争力的性能特征。 在某些情况下,它们在algorithm上和实际时间上几乎与可变集合一样快,有时甚至更快,而在其他情况下,它们在algorithm上更复杂。 然而,在很多情况下,这种差异是微不足道的。 一般来说,您应该使用最简单的代码来完成工作,然后根据需要调整性能。 不可变的集合可以帮助你编写简单的代码,特别是在需要考虑线程安全的情况下。

换句话说,在许多情况下,差异将不会被注意到,你应该select简单的select – 对于并发集合来说,使用ImmutableHashSet<T> ,因为你没有现有的locking可变实现! 🙂

关于使一个ISet<T>并发的棘手部分是set方法(union,intersection,difference)本质上是迭代的。 至less你必须迭代操作涉及的集合中的所有n个成员,同时locking两个集合。

如果在迭代过程中必须locking整个集合,则会失去ConcurrentDictionary<T,byte>的优点。 没有locking,这些操作不是线程安全的。

考虑到ConcurrentDictionary<T,byte>的额外开销,使用更轻量级的HashSet<T>可能更为明智,只是将所有内容都包含在锁中。

如果您不需要set操作,请使用ConcurrentDictionary<T,byte>并在添加键时仅使用default(byte)作为值。

我更喜欢完整的解决scheme,所以我这样做:请注意,我的Count是以不同的方式实现的,因为我不明白为什么在尝试计算其值时应该禁止读取哈希集。

@禅,感谢您的启动。

 [DebuggerDisplay("Count = {Count}")] [Serializable] public class ConcurrentHashSet<T> : ICollection<T>, ISet<T>, ISerializable, IDeserializationCallback { private readonly ReaderWriterLockSlim _lock = new ReaderWriterLockSlim(LockRecursionPolicy.SupportsRecursion); private readonly HashSet<T> _hashSet = new HashSet<T>(); public ConcurrentHashSet() { } public ConcurrentHashSet(IEqualityComparer<T> comparer) { _hashSet = new HashSet<T>(comparer); } public ConcurrentHashSet(IEnumerable<T> collection) { _hashSet = new HashSet<T>(collection); } public ConcurrentHashSet(IEnumerable<T> collection, IEqualityComparer<T> comparer) { _hashSet = new HashSet<T>(collection, comparer); } protected ConcurrentHashSet(SerializationInfo info, StreamingContext context) { _hashSet = new HashSet<T>(); // not sure about this one really... var iSerializable = _hashSet as ISerializable; iSerializable.GetObjectData(info, context); } #region Dispose public void Dispose() { Dispose(true); GC.SuppressFinalize(this); } protected virtual void Dispose(bool disposing) { if (disposing) if (_lock != null) _lock.Dispose(); } public IEnumerator<T> GetEnumerator() { return _hashSet.GetEnumerator(); } ~ConcurrentHashSet() { Dispose(false); } public void OnDeserialization(object sender) { _hashSet.OnDeserialization(sender); } public void GetObjectData(SerializationInfo info, StreamingContext context) { _hashSet.GetObjectData(info, context); } IEnumerator IEnumerable.GetEnumerator() { return GetEnumerator(); } #endregion public void Add(T item) { _lock.EnterWriteLock(); try { _hashSet.Add(item); } finally { if(_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public void UnionWith(IEnumerable<T> other) { _lock.EnterWriteLock(); _lock.EnterReadLock(); try { _hashSet.UnionWith(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); if (_lock.IsReadLockHeld) _lock.ExitReadLock(); } } public void IntersectWith(IEnumerable<T> other) { _lock.EnterWriteLock(); _lock.EnterReadLock(); try { _hashSet.IntersectWith(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); if (_lock.IsReadLockHeld) _lock.ExitReadLock(); } } public void ExceptWith(IEnumerable<T> other) { _lock.EnterWriteLock(); _lock.EnterReadLock(); try { _hashSet.ExceptWith(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); if (_lock.IsReadLockHeld) _lock.ExitReadLock(); } } public void SymmetricExceptWith(IEnumerable<T> other) { _lock.EnterWriteLock(); try { _hashSet.SymmetricExceptWith(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool IsSubsetOf(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.IsSubsetOf(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool IsSupersetOf(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.IsSupersetOf(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool IsProperSupersetOf(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.IsProperSupersetOf(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool IsProperSubsetOf(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.IsProperSubsetOf(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool Overlaps(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.Overlaps(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool SetEquals(IEnumerable<T> other) { _lock.EnterWriteLock(); try { return _hashSet.SetEquals(other); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } bool ISet<T>.Add(T item) { _lock.EnterWriteLock(); try { return _hashSet.Add(item); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public void Clear() { _lock.EnterWriteLock(); try { _hashSet.Clear(); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool Contains(T item) { _lock.EnterWriteLock(); try { return _hashSet.Contains(item); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public void CopyTo(T[] array, int arrayIndex) { _lock.EnterWriteLock(); try { _hashSet.CopyTo(array, arrayIndex); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public bool Remove(T item) { _lock.EnterWriteLock(); try { return _hashSet.Remove(item); } finally { if (_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } public int Count { get { _lock.EnterWriteLock(); try { return _hashSet.Count; } finally { if(_lock.IsWriteLockHeld) _lock.ExitWriteLock(); } } } public bool IsReadOnly { get { return false; } } }