最近在使用log4net记录日志的时候,碰到一个阻塞问题,即某个看起来毫不相干的事件会导致程序不再打印日志,并且该日志文件提示被占用,无法删除和修改,同时报出了以下异常:
ERROR Failed to append to appender [MyAppender]
System.Threading.ThreadAbortException: 正在中止线程。
在 System.Threading.Monitor.ReliableEnter(Object obj, Boolean& lockTaken)
在 log4net.Appender.AppenderSkeleton.DoAppend(LoggingEvent loggingEvent)
在 log4net.Util.AppenderAttachedImpl.AppendLoopOnAppenders(LoggingEvent loggingEvent)
ERROR Exception while logging
System.Threading.ThreadAbortException: 正在中止线程。
在 log4net.Util.AppenderAttachedImpl.AppendLoopOnAppenders(LoggingEvent loggingEvent)
在 log4net.Repository.Hierarchy.Logger.CallAppenders(LoggingEvent loggingEvent)
在 log4net.Repository.Hierarchy.Logger.ForcedLog(Type callerStackBoundaryDeclaringType, Level level, Object message, Exception exception)
在 log4net.Repository.Hierarchy.Logger.Log(Type callerStackBoundaryDeclaringType, Level level, Object message, Exception exception)
于是问题来了:
1、我们配置的是最小锁,按道理不应该无法释放文件
2、看了log4的源码,这个异常应该是能够catch到的,但是为什么会一直往上抛
3、线程内的异常抛到了线程外,为什么没有导致程序崩溃
由于MyAppender是我开发的,用来提供压缩日志功能,因此一开始以为是这个我的appender存在bug。但是检查一遍之后并没有发现有什么问题。转了一圈log4net社区之后也没有发现有人提到这样的问题。遂只能看下调用方的使用方式,于是发现了调用方的一个奇怪操作。
调用方在进行某个事件时,会不停的创建线程,并且没有让线程自然结束,而是使用了Abort()方法强制结束线程。然后来看下微软对abort方法的说明:
Remarks
When this method is invoked on a thread, the system throws a ThreadAbortException in the thread to abort it. ThreadAbortException is a special exception that can be caught by application code, but is re-thrown at the end of the catchblock unless ResetAbort is called. ResetAbort cancels the request to abort, and prevents the ThreadAbortException from terminating the thread. Unexecuted finally blocks are executed before the thread is aborted.
可以看到,这个abort()的方法并不是直接使线程停止,而是通过在线程内抛出异常来达到线程中断的目的,并且这个异常是个特殊异常,虽然可以被捕获,但是依然会上抛到线程外,并且不会被全局异常捕获,这也解释了问题2和3。
Note
When a thread calls Abort on itself, the effect is similar to throwing an exception; the ThreadAbortException happens immediately, and the result is predictable. However, if one thread calls Abort on another thread, the abort interrupts whatever code is running.
在调用了abort方法后,除非线程在执行非托管代码,否则线程将立刻抛出异常。那么对写文件来说,就将存在刚把文件打开,这个线程就被终止了,或者说刚写完文件,还没来得及释放就被终止了的情况。这个很容易证明:
Thread th=new Thread(() =>
{
FileStream file = File.Open(@"TestLog4net.txt",FileMode.Open);
Thread.Sleep(2000);
});
th.Start();
Thread.Sleep(1000);
th.Abort();
这时候TestLog4net.txt这个文件将提示被占用。当然,由于这个异常时可以捕获的,因此完全可以通过try-catch-finally来释放文件。但是在log4net里面,有个:
override protected void Append(LoggingEvent loggingEvent)
{
if (m_stream.AcquireLock())
{
try
{
base.Append(loggingEvent);
}
finally
{
m_stream.ReleaseLock();
}
}
}
可以看到,这个AcquireLock()并没有在try-catch中,而正是在这个方法中打开了文件流,并只有在ReleaseLock()中才会释放掉。因此如果在AcquireLock()执行时中断了线程,那么问题1就发生了。
这种占用,除了上面说的在try-catch块中解决,还可以通过调用GC的方式让他进行回收。
结论:
1、abort()是个很危险的方法,因为你不知道线程什么时候被终止,无法清理数据。如果想让线程中断,尽量使用信号量等方式来让线程正常结束。
2、在使用第三方的库的时候,最好能够做线程隔离,或者尽量不要在他们的线程中做太多操作,因为你不知道他们会有什么骚操作。
最后我们通过线程池来异步写文件来避免这个坑。