Contributing to PyPI
HNet代表图形化超几何网络,它是一种通过统计推断来检验变量间关联的显著性的方法。 其目的是确定一个具有重要关联的网络,可以揭示变量之间的复杂关系。 输入数据集的范围从一般的数据帧到带有列表、缺失值和枚举的嵌套数据结构。在
真实世界的数据通常包含连续值和离散值的测量值。 尽管有许多库,但混合数据类型的数据集需要密集的预处理步骤, 如何描述变量之间的关系仍然是一个挑战。 数据理解阶段对数据挖掘过程至关重要,但是,在没有对数据进行任何假设的情况下, 搜索空间在变量数量上是超指数的。因此,彻底的数据理解阶段不是常见的做法。在
方法
我们提出了图形超几何网络(),这是一种使用统计推断测试变量间关联的显著性的方法。其目的是确定一个只使用重要关联的网络,以阐明变量之间的复杂关系。HNet处理原始的非结构化数据集,并输出由节点之间(部分)有向或无向边(即变量)组成的网络。为了评估HNet的准确性,我们使用已知的数据集和生成的具有已知基本真相的数据集。此外,还比较了HNet与贝叶斯关联学习的性能。在
结果
我们证明了HNet在节点链路检测方面表现出了很高的准确性和性能。在报警数据集的情况下,我们可以证明平均MCC得分为0.33+0.0002(P<;1x10-6),而贝叶斯关联学习的平均MCC得分为0.52+0.006(P<;1x10-11),随机分配边缘的MCC得分为0.004+0.0003(P=0.49)。在
结论
HNet克服了对原始非结构化数据集的处理,它允许分析混合数据类型,它很容易扩展变量的数量,并允许对检测到的关联进行详细检查。在
文档
API文档:https://erdogant.github.io/hnet/文章:https://arxiv.org/abs/2005.04679 ^{1}$ 在
从PyPI安装hnet(推荐)。Hnet与Python3.6+兼容,可在Linux、MacOS X和Windows上运行。 它是在Apache2.0许可下发布的。在 ^{pr2}$ 泰坦尼克号数据集的简单示例在泰坦尼克号数据集上进行关联学习。 在
d3graph Titanic <;link rel=“导入”href=“https://erdogant.github.io/docs/d3graph/titanic_example/index.html“>; 总结结果。网络会变成巨大的毛球,热图无法阅读。您可能希望查看类别之间的常规关联,而不是标签关联。 使用summary功能,结果将按类别汇总。在
在
功能重要性 在
性能 在
如果这对你的研究有用,请在你的出版物中引用。在
arXivArticle in pdfSphinxGithub这是BibTeX条目:
欢迎加入QQ群-->: 979659372
最近更新生活资讯
- 反转再反转,这部科幻末世灾难片真的爽
- 快捷指令sky电影捷径库
- 2021《自然》年度十大人物:塑造科学,造福社会
- 千里单骑救萝莉却被捕,“正义使者”成了谁的牺牲品?
- 浪漫爱情励志人生 最震撼人心的十部日剧(图)
- 短篇小说(家庭伦理)
- 推动农业绿色低碳循环发展 推动农业绿色发展、协调发展
- 资料:成奎安电影作品《灯草和尚》(1992)
- 稻盛和夫《活法》1
- 合肥市第六中学2019-2020学年下学期2019 级高一年级线上线下教学衔接学
- 全网的电视剧,电影和动漫无偿观看(每年的都有哦)
- 理想国
- 刺激!梅州首部限制级伦理微电影《幻镜》网络首映!
- 男人为何迷恋女人胸部?
- 陆小曼与林徽因:都是富养的女儿,差别在哪里?
- 问题已被解决?
- 看了多少烂片,才找出这92部经典!
- 金高银:怎么从拿8个电影奖的怪物新人沦为了被众嘲的“资源咖”?
- 猎天下第2部:河阴之变
- 封神演义读后感100字(五篇)
- 又一部岛国神作,堪称校园版《权力的游戏》!
- 【全面解读】2022年以后,再无“国产”BCBA?
- 鬼文化(商代的帝王文化))
- 豆瓣9.2分年度第一佳片,每一秒都是夏日初恋的味道
- 社会的重器:性侵犯罪信息统一查询平台,还校园一片蓝天