Haskell:如何对运行外部命令的函数设置超时?

17

我在函数内调用了一个外部程序。现在我想要超时这个函数,而不仅仅是外部程序。但是在函数超时后,外部程序仍然在我的计算机上运行(我使用的是Debian),直到它完成其计算,之后它的线程仍然作为我的主程序的子线程保留在进程表中,直到主程序终止。

这里有两个最简示例说明我想要做的事情。第一个使用unsafePerformIO,第二个完全在IO monad中。我并不是非常依赖于unsafePerformIO,但如果可能的话,我想保留它。所述问题无论是否使用unsafePerformIO都会发生。

使用unsafePerformIO

module Main where

import System.Timeout
import Criterion.Measurement
import System.IO.Unsafe
import System.Process

main = do
    x <- time $ timeoutP (1 * 1000000) $ mytest 2
    y <- getLine
    putStrLn $ show x ++ y

timeoutP :: Int -> a -> IO (Maybe a)
timeoutP t fun = timeout t $ return $! fun

mytest :: Int -> String
mytest n =
  let
    x = runOnExternalProgram $ n * 1000
  in
    x ++ ". Indeed."

runOnExternalProgram :: Int -> String
runOnExternalProgram n = unsafePerformIO $ do
    -- convert the input to a parameter of the external program
    let x = show $ n + 12
    -- run the external program
    -- (here i use "sleep" to indicate a slow computation)
    answer <- readProcess "sleep" [x] ""
    -- convert the output as needed
    let verboseAnswer = "External program answered: " ++ answer
    return verboseAnswer

没有使用unsafePerformIO

module Main where

import System.Timeout
import Criterion.Measurement
import System.IO.Unsafe
import System.Process

main = do
    x <- time $ timeout (1 * 1000000) $ mytest 2
    y <- getLine
    putStrLn $ show x ++ y

mytest :: Int -> IO String
mytest n = do
    x <- runOnExternalProgram $ n * 1000
    return $ x ++ ". Indeed."

runOnExternalProgram :: Int -> IO String
runOnExternalProgram n = do
    -- convert the input to a parameter for the external program:
    let x = show $ n + 12
    -- run the external program
    -- (here i use "sleep" to indicate a slow computation):
    answer <- readProcess "sleep" [x] ""
    -- convert the output as needed:
    let verboseAnswer = "External program answered: " ++ answer
    return verboseAnswer

也许括号在这里可以帮助,但我不太清楚如何使用。

编辑:我采用了John L的答案。现在我正在使用以下内容:

import Control.Concurrent
import Control.Exception
import System.Exit
import System.IO
import System.IO.Error
import System.Posix.Signals
import System.Process
import System.Process.Internals

safeCreateProcess :: String -> [String] -> StdStream -> StdStream -> StdStream
                  -> ( ( Maybe Handle
                       , Maybe Handle
                       , Maybe Handle
                       , ProcessHandle
                       ) -> IO a )
                  -> IO a
safeCreateProcess prog args streamIn streamOut streamErr fun = bracket
    ( do
        h <- createProcess (proc prog args) 
                 { std_in  = streamIn
                 , std_out = streamOut
                 , std_err = streamErr
                 , create_group = True }
        return h
    )
-- "interruptProcessGroupOf" is in the new System.Process. Since some
-- programs return funny exit codes i implemented a "terminateProcessGroupOf".
--    (\(_, _, _, ph) -> interruptProcessGroupOf ph >> waitForProcess ph)
    (\(_, _, _, ph) -> terminateProcessGroup ph >> waitForProcess ph)
    fun
{-# NOINLINE safeCreateProcess #-}

safeReadProcess :: String -> [String] -> String -> IO String
safeReadProcess prog args str =
    safeCreateProcess prog args CreatePipe CreatePipe Inherit
      (\(Just inh, Just outh, _, ph) -> do
        hPutStr inh str
        hClose inh
        -- fork a thread to consume output
        output <- hGetContents outh
        outMVar <- newEmptyMVar
        forkIO $ evaluate (length output) >> putMVar outMVar ()
        -- wait on output
        takeMVar outMVar
        hClose outh
        return output
-- The following would be great, if some programs did not return funny
-- exit codes!
--            ex <- waitForProcess ph
--            case ex of
--                ExitSuccess -> return output
--                ExitFailure r ->
--                    fail ("spawned process " ++ prog ++ " exit: " ++ show r)
      )

terminateProcessGroup :: ProcessHandle -> IO ()
terminateProcessGroup ph = do
    let (ProcessHandle pmvar) = ph
    ph_ <- readMVar pmvar
    case ph_ of
        OpenHandle pid -> do  -- pid is a POSIX pid
            signalProcessGroup 15 pid
        otherwise -> return ()

这解决了我的问题。它在正确的时间杀死了所有生成进程的子进程。
此致敬礼。

你尝试过使用Control.Exception.evaluate代替return $! a吗? - ehird
@ehird:我使用evaluate得到了相同的行为。 - Josephine
1个回答

9

编辑:可以获得已生成进程的PID。您可以使用以下代码获取:

-- highly non-portable, and liable to change between versions
import System.Process.Internals

-- from the finalizer of the bracketed function
-- `ph` is a ProcessHandle as returned by createProcess
  (\(_,_,_,ph) -> do
    let (ProcessHandle pmvar) = ph
    ph_ <- takeMVar pmvar
    case ph_ of
      OpenHandle pid -> do  -- pid is a POSIX pid
        ... -- do stuff
        putMVar pmvar ph_

如果你杀掉了进程,而不是将打开的ph_放入mvar中,那么你应该创建一个适当的ClosedHandle并将其放回去。这段代码执行时必须要掩盖(bracket可以为你做到这一点)。
现在你有了一个POSIX ID,你可以根据需要使用系统调用或外壳来终止它。只要小心,如果你选择这条路,你的Haskell可执行文件不要在同一个进程组中。
这种行为似乎有点合理。 timeout的文档声称它对非Haskell代码根本不起作用,事实上我看不出它如何通用地工作。正在发生的是readProcess会产生一个新的进程,但在等待该进程输出时被超时。似乎readProcess在异常终止时没有终止生成的进程。这可能是readProcess的错误,也可能是设计如此。
作为解决方法,我认为你需要自己实现一些内容。timeout通过在生成的线程中引发异步异常来工作。如果将你的runOnExternalProgram包装在异常处理程序中,你就会得到想要的行为。
关键函数在于新的runOnExternalProgram,它是你原来的函数和readProcess的组合。更好(更模块化,更可重用,更易于维护)的方法是制作一个新的readProcess,当引发异常时终止生成的进程,但我将其留作练习。
module Main where

import System.Timeout
import Criterion.Measurement
import System.IO.Unsafe
import System.Process
import Control.Exception
import System.IO
import System.IO.Error
import GHC.IO.Exception
import System.Exit
import Control.Concurrent.MVar
import Control.Concurrent

main = do
    x <- time $ timeoutP (1 * 1000000) $ mytest 2
    y <- getLine
    putStrLn $ show x ++ y

timeoutP :: Int -> IO a -> IO (Maybe a)
timeoutP t fun = timeout t $ fun

mytest :: Int -> IO String
mytest n = do
  x <- runOnExternalProgram $ n * 1000
  return $ x ++ ". Indeed."

runOnExternalProgram :: Int -> IO String
runOnExternalProgram n = 
    -- convert the input to a parameter of the external program
    let x = show $ n + 12
    in bracketOnError
        (createProcess (proc "sleep" [x]){std_in = CreatePipe
                                         ,std_out = CreatePipe
                                         ,std_err = Inherit})
        (\(Just inh, Just outh, _, pid) -> terminateProcess pid >> waitForProcess pid)

        (\(Just inh, Just outh, _, pid) -> do
          -- fork a thread to consume output
          output <- hGetContents outh
          outMVar <- newEmptyMVar
          forkIO $ evaluate (length output) >> putMVar outMVar ()

          -- no input in this case
          hClose inh

          -- wait on output
          takeMVar outMVar
          hClose outh

          -- wait for process
          ex <- waitForProcess pid

          case ex of
            ExitSuccess -> do
              -- convert the output as needed
              let verboseAnswer = "External program answered: " ++ output
              return verboseAnswer
            ExitFailure r ->
              ioError (mkIOError OtherError ("spawned process exit: " ++ show r) Nothing Nothing) )

1
你必须使用 Control.Exception.bracket 或手动使用 mask 来改进这个问题。在 createProcess 之后和 handle 之前,我可以杀掉上述代码并导致代码表现不正常。 - Chris Kuklewicz
@John L:感谢您对“异步异常”的建议。您的方法在超时后停止了外部程序的执行,但仍然留下了一个子线程,因为在“terminateProcess”之后没有“waitForProcess”。除此之外,它几乎是我在问题中编辑的“bracket”方法的复制,并且遇到了相同的问题。我相信“bracket”方法不会遇到Chris Kuklewicz指出的问题。干杯。 - Josephine
1
@ChrisKuklewicz:当然,您是正确的,应该使用bracket。现在已经修复了。实际上我使用了bracketOnError,因为如果主体正常返回,进程应该已经终止。 - John L
@André:但是现在僵尸很流行啊!这个也修复了。 - John L

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接