Data.ByteString 和 Data.ByteString.Char8 的区别

Question

Data.ByteString 和 Data.ByteString.Char8 的区别

6

我读到，Char8仅支持ASCII字符，如果您使用其他Unicode字符，则使用它可能会很危险。

{-# LANGUAGE OverloadedStrings #-}

--import qualified Data.ByteString as B
import qualified Data.ByteString.Char8 as BC
import qualified Data.Text.IO as TIO
import qualified Data.Text.Encoding as E
import qualified Data.Text as T

name :: T.Text
name = "{ \"name\": \"哈时刻\" }"

nameB :: BC.ByteString
nameB = E.encodeUtf8 name

main :: IO ()
main = do
  BC.writeFile "test.json" nameB
  putStrLn "done"

产生相同的结果，就像

{-# LANGUAGE OverloadedStrings #-}

import qualified Data.ByteString as B
--import qualified Data.ByteString.Char8 as BC
import qualified Data.Text.IO as TIO
import qualified Data.Text.Encoding as E
import qualified Data.Text as T

name :: T.Text
name = "{ \"name\": \"哈时刻\" }"

nameB :: B.ByteString
nameB = E.encodeUtf8 name

main :: IO ()
main = do
  B.writeFile "test.json" nameB
  putStrLn "done"

那么，使用 Data.ByteString.Char8 和 Data.ByteString 有什么区别呢？

- laiboonh

请注意，您的两个程序实际上是相同的。类型BC.ByteString是Data.ByteString.ByteString的重新导出，您将其用作B.ByteString - 因此这些字面上是指相同的类型，所有代码都是相同的，所以... - Thomas M. DuBuisson

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Alec · Accepted Answer

如果你比较 Data.ByteString 和 Data.ByteString.Char8，你会发现许多在前者中引用 Word8 的函数，在后者中引用了 Char。

-- Data.ByteString
map :: (Word8 -> Word8) -> ByteString -> ByteString
cons :: Word8 -> ByteString -> ByteString
snoc :: ByteString -> Word8 -> ByteString
head :: ByteString -> Word8
uncons :: ByteString -> Maybe (Word8, ByteString) 
{- and so on... -}


-- Data.ByteString.Char8
map :: (Char -> Char) -> ByteString -> ByteString
cons :: Char -> ByteString -> ByteString
snoc :: ByteString -> Char -> ByteString
head :: ByteString -> Char
uncons :: ByteString -> Maybe (Char, ByteString) 
{- and so on... -}

对于这些功能，Data.ByteString.Char8 提供了便利，不必不断地将 Word8 值转换为 Char 值。在这些函数中，只有这种情况下才会提供此类便利。writeFile 在两个模块中的行为完全相同。 以下是一种很好的方式，可以看到 Text、ByteString 和 ByteString.Char8 中类似函数的不同行为：

{-# LANGUAGE OverloadedStrings #-}

import Data.Text.Encoding

import qualified Data.Text as T
import qualified Data.ByteString as B
import qualified Data.ByteString.Char8 as BC

nameText :: T.Text
nameText = "哈时刻"

nameByteString :: B.ByteString
nameByteString = encodeUtf8 nameText

main :: IO ()
main = do
  print $ T.head nameText               -- '\21704'     actual first character
  print $ B.head nameByteString         -- 229          first byte
  print $ BC.head nameByteString        -- '\299'       first byte as character

  putStrLn [ T.head nameText ]          -- 哈           actual first character
  putStrLn [ BC.head nameByteString ]   -- å            first byte as character