如何使用C#将来自mongo db源的json文件转换为Parquet文件?
我找到了一个名为Parquet.Net的库,但我需要更动态的东西。 我拥有的数据非常动态,很难在其中构建模式,如果您有解决此问题的方法,请告诉我。
var file = File.ReadAllLines(@"C:\Users\NodeJS\Downloads\countries.json");
List<object> tt = new List<object>();
var fields = new HashSet<DataField>();
foreach (var item in file)
{
var entity = JsonConvert.DeserializeObject<JObject>(item).ToObject<Dictionary<string, object>>();
foreach(var t in entity)
{
fields.Add(new DataField(t.Key, t.Value.GetType()));
tt.Add(t.Value);
}
}
var schema = new Schema(fields);
using (Stream fileStream = System.IO.File.Create("convertJson.parquet"))
{
ParquetConvert.Serialize(tt, fileStream,schema);
}