当前位置: 首页 > news >正文

上海中小企业网站建设/广州aso优化公司 有限公司

上海中小企业网站建设,广州aso优化公司 有限公司,wordpress 5.0.2关键词设置,网站建设 猴王网络本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第2章,第2.11节解析自定义数据格式,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看 2.11 解析自定义数据格式如果你处理的数据足够…

本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第2章,第2.11节解析自定义数据格式,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看

2.11 解析自定义数据格式
如果你处理的数据足够长,你最终会遇到没有任何库能处理的,你需要编写自己的解析器。对于一些格式而言正则表达式就足够了,但是如果你需要保持输入中的句法结构平衡或对输出做一些复杂的工作,最好创建一个自定义的解析器。对于数据量大的输入自定义解析器会比正则表达式处理速度慢,但有时它们仍是最好的选项。
Clojure语言(以及大多数函数式编程语言)适合解析,并且多数包含可以极度简化编写解析器的解析器连接库。
在本方法中,作为需要解析的数据格式的例子,处理一些FASTA数据(http://en.wikipedia.org/wiki/FASTA_format)。FASTA是一种在生物信息学中交换核甘酸和缩氨酸序列中使用的数据格式。当然已有这类数据的解析器,但简易性和自定义的数据格式使其成为本方法中合适的样例。
FASTA数据的第一行以一个>符号开头,后跟一个唯一的标识符。这一行中通常包含样本的其他描述信息、它来自的数据库以及其他信息。关于FASTA数据的更详细的解释在http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml中。一条FASTA记录如下:


fd109344f74e3e5614e9294da4836bf12ae98607


5760c592ae00f052a5d23fd57636ccb0269cecf4

2.11.3 实现原理
从最抽象的层次上来说,解析器是函数。它们以字符串为输入返回一种数据结构。更复杂一点,通过组合较简单的元素构建高级的解析器。
<|函数是一个很好的例子。它本身并不解析任何内容。然而,它通过以一种有效的方式将另外两个解析器结合起来:它解析两部分内容并将第二部分的结果舍弃。
acid-code函数是从基本部件构建解析器的例子。它匹配集合中的任意字符。
接着acid-code-line结合acid-code解析器。它匹配一个或多个acid-code字符,有的包含换行符。它使用<|连接器丢弃新的一行并返回acid-codes的序列。
整个解析器由简单的部分组成复杂的结构。尽管这是一个非常基础的解析器,但是可以按这种方式创建更为复杂的解析器,利用Clojure的强大功能使代码具有高可读性和可维护性。

http://www.lbrq.cn/news/1306819.html

相关文章:

  • 网站建设模式/优化网站视频
  • 响应网站怎么做教学视频/关键词查询网站
  • asp网站关键字/seo和sem的区别是什么?
  • 快站app下载/黑锋网seo
  • 独立个人博客网站制作/手机百度识图网页版入口
  • 建立网站如何盈利/昆明seo网站管理
  • 中国建设银行网站密码是什么意思/关键词排名是什么意思
  • 静安网站建设哪里有/百度快速收录技术
  • 南阳锐诚网站建设/搜索引擎最佳化
  • 四川省建设厅网站官网/网上推销产品去什么平台
  • 网站病毒视频/今天高清视频免费播放
  • 自己建网站 怎么做后台/安徽百度seo公司
  • 重庆万州网站建设找谁/seo计费系统登录
  • 做网站怎么收集资料/搜索推广竞价托管哪家好
  • 电商网站开发设计/免备案域名
  • 广州微网站建设效果/个人网站seo入门
  • 新开传奇网站180火龙/百度云建站
  • icp域名备案查询系统/seo关键词挖掘
  • 做公司年报网站登录密码是什么/百度最新人工智能
  • 做asp网站需要的实验报告单/企业网站优化哪家好
  • 整站快速排名优化/疫情最新资讯
  • 电子商务网站规划的原则/网站关键词挖掘
  • 阿里网站建设/竞价账户托管公司哪家好
  • 公司网站域名cn和com/百度工具seo
  • wordpress无法开启多站点/公司做网站推广
  • 电子商务的网站怎么做/关于友谊的连接
  • 织梦dedecms医院类网站在线预约挂号插件_utf8/全网推广费用
  • 网站创作思路/网站搜索排名优化价格
  • 做淘宝网站报告/sem是什么
  • 如何使用万网主机建设网站/济南全网推广
  • 区块链之Casper协议背景、演变发展、运作机制和潜在风险
  • 【软件开发】Copilot 编码插件
  • rocky8 --Elasticsearch+Logstash+Filebeat+Kibana部署【7.1.1版本】
  • 基于大数据电信诈骗行为分析与可视化预测系统的设计与实现【海量数据、多种机器学习对比、数据优化、过采样】
  • UDP和TCP的主要区别是什么?
  • 主机安全---开源wazuh使用