Python中的“无法启动新线程错误”

4

我正在运行一个从Debian软件包中提取信息并将其保存到数据库的脚本。

在提取了大约100个软件包的信息之后,出现了一个错误。错误是“无法启动新线程”。

我为什么会遇到这个错误?有什么可能的解决方案吗?

以下是用于保存数据的代码:

for i in list_pack:

      if not i in oblist:        
        #Creating Packages
            slu=slugify(i)
            ob=Gbobject()
            ob.title=i
            ob.slug=slu
            ob.content=''
            ob.tags=tagname
        #with reversion.create_revision():
            ob.save()
            gb=Gbobject.objects.get(title=i)
            gb.objecttypes.add(Objecttype.objects.get(title='Packages'))
            gb.sites.add(Site.objects.get_current())
        #with reversion.create_revision():
            gb.save()
            gd=Gbobject.objects.get(title=i)
            print 'The Object created was',gd


            #Decsription
            try:
                atv=package_description_dict[i]
                atvalue=unicode(atv,'utf-8')
            except UnicodeDecodeError:
                pass
            try:
                lo=Gbobject.objects.get(title=i)
                loid=NID.objects.get(id=lo.id)
            except Gbobject.DoesNotExist:
                pass
            if atvalue<>'':
                slu=slugify(atvalue)
                at=Attribute()
                at.title=atvalue
                at.slug=slu
                at.svalue=atvalue
                at.subject=loid
                att=Attributetype.objects.get(title='Description')
                at.attributetype=att
                #with reversion.create_revision():
                at.save()                    
                print 'yeloow13'

就像Description一样,这个包还有大约12个类似方式保存的属性。

这是错误发生时我得到的完整回溯:

    error                                     Traceback (most recent call last)

/home/radhika/Desktop/dev_75/gnowsys-studio/demo/<ipython console> in <module>()

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/gstudio/Harvest/debdata.py in <module>()
   1086 # create_attribute_type()

   1087 # create_relation_type()

-> 1088 create_objects()
   1089 #create_sec_objects()

   1090 #create_relations()


/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/gstudio/Harvest/debdata.py in create_objects()
    403             ob.sites.add(Site.objects.get_current())
    404             #with reversion.create_revision():

--> 405             ob.save()
    406             #time.sleep(10)

    407             #gd=Gbobject.objects.get(title=i)


/usr/local/lib/python2.6/dist-packages/django_reversion-1.6.0-py2.6.egg/reversion/revisions.pyc in do_revision_context(*args, **kwargs)
    298             try:
    299                 try:
--> 300                     return func(*args, **kwargs)
    301                 except:
    302                     exception = True

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/objectapp/models.pyc in save(self, *args, **kwargs)
    658     @reversion.create_revision()
    659     def save(self, *args, **kwargs):
--> 660         super(Gbobject, self).save(*args, **kwargs) # Call the "real" save() method.
    661 
    662 

/usr/local/lib/python2.6/dist-packages/django_reversion-1.6.0-py2.6.egg/reversion/revisions.pyc in do_revision_context(*args, **kwargs)
    298             try:
    299                 try:
--> 300                     return func(*args, **kwargs)
    301                 except:
    302                     exception = True

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/gstudio/models.pyc in save(self, *args, **kwargs)
    327     @reversion.create_revision()
    328     def save(self, *args, **kwargs):
--> 329         super(Node, self).save(*args, **kwargs) # Call the "real" save() method.
    330 
    331 

/usr/local/lib/python2.6/dist-packages/django/db/models/base.pyc in save(self, force_insert, force_update, using)
    458         if force_insert and force_update:
    459             raise ValueError("Cannot force both insert and updating in model saving.")
--> 460         self.save_base(using=using, force_insert=force_insert, force_update=force_update)
    461 
    462     save.alters_data = True

/usr/local/lib/python2.6/dist-packages/django/db/models/base.pyc in save_base(self, raw, cls, origin, force_insert, force_update, using)
    568         if origin and not meta.auto_created:
    569             signals.post_save.send(sender=origin, instance=self,
--> 570                 created=(not record_exists), raw=raw, using=using)
    571 
    572 

/usr/local/lib/python2.6/dist-packages/django/dispatch/dispatcher.pyc in send(self, sender, **named)
    170 
    171         for receiver in self._live_receivers(_make_id(sender)):
--> 172             response = receiver(signal=self, sender=sender, **named)
    173             responses.append((receiver, response))
    174         return responses

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/objectapp/signals.pyc in wrapper(*args, **kwargs)
     65             if inspect.getmodulename(fr[1]) == 'loaddata':
     66                 return
---> 67         signal_handler(*args, **kwargs)
     68 
     69     return wrapper

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/objectapp/signals.pyc in ping_external_urls_handler(sender, **kwargs)
     90         from objectapp.ping import ExternalUrlsPinger
     91 
---> 92         ExternalUrlsPinger(gbobject)
     93 
     94 

/usr/local/lib/python2.6/dist-packages/django_gstudio-0.3.dev-py2.6.egg/objectapp/ping.pyc in __init__(self, gbobject, timeout, start_now)
    153         threading.Thread.__init__(self)
    154         if start_now:
--> 155             self.start()
    156 
    157     def run(self):

/usr/lib/python2.6/threading.pyc in start(self)
    472         _active_limbo_lock.release()
    473         try:
--> 474             _start_new_thread(self.__bootstrap, ())
    475         except Exception:
    476             with _active_limbo_lock:

error: can't start new thread

我不会编写任何处理线程的代码。


5
请发布您获得的回溯信息。 - Bittrance
1
线程Thread-697中的异常: Traceback(最近的调用在最后): 在“/usr/lib/python2.7/threading.py”文件的第552行,“__bootstrap_inner”方法中, self.run() 在“/usr/local/lib/python2.7/dist-packages/django_gstudio-0.3.dev-py2.7.egg/objectapp/ping.py”文件的第113行, run()方法 reply = self.ping_gbobject(gbobject) 在“/usr/local/lib/python2.7/dist-packages/django_gstudio-0.3.dev-py2.7.egg/objectapp/ping.py”文件的第121行, ping_gbobject()方法 gbobject.get_absolute_url()) 在“/usr/local/lib/python2.7/dist-packages/django/utils/functional.py”文件的第11行,“_curried”方法中。 - Rads
那是完整的回溯吗?我将其复制到您的问题中,但似乎不完整? - jdi
请展示一下您如何启动线程。关于保存数据库数据的部分与此无关。 - jdi
2个回答

13

很抱歉这里只提供了不完整的解决方案,我的评级不够在评论区发布。

有一件事情需要检查,那就是你正在运行的线程总数。我有一些代码可以使用“sys”检查核心数量,然后启动线程并检查核心负载,以测试操作系统如何处理线程分配,我了解到例如Windows 7 在8(逻辑)核心CPU上的32个线程之后似乎会出现错误(在Python 2.7、Win 7 64位等环境下,结果可能因人而异)。在其他机器上,我可以超过1,000个线程。

所以我猜短版是:当您遇到该错误时,您已经有多少个线程在运行?您可以使用

threading.active_count()

除此之外,你没有在这里提供代码的线程部分,因此我建议你查看这个优秀的Python Central页面

你还可以从这个之前的Stack Overflow讨论中受益,该讨论关于如何处理大量线程任务。

再次道歉,这是一个指向方向而不是解决方案,我认为需要更多信息才能帮助我们理解你遇到的问题。


2
我认为这是一个很好的回答,适合于模糊的问题。你建议OP启动了太多的线程,这是一个好的方向。 - jdi

0
你正在使用32位系统并且虚拟内存不足。你的其中一个库可能正在生成线程,但没有正确回收它们。作为解决方法,尝试通过threading.stack_size减少默认线程堆栈大小。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接