您现在的位置是:网站首页> 编程资料编程资料
Ruby中使用Nokogiri包来操作XML格式数据的教程_ruby专题_
2023-05-26
324人已围观
简介 Ruby中使用Nokogiri包来操作XML格式数据的教程_ruby专题_
安装
对于Ubuntu,需要安装好 libxml2, libxslt 这两个组件:
$ apt-get install libxml2 libxslt
然后就可以:
$ gem install nokogiri
可选项
nokogiri提供了一些解析文件时的可选项,常用的有:
- NOBLANKS : 删除空节点
- NOENT : 替代实体
- NOERROR : 隐藏错误报告
- STRICT : 精确解析,当解析到文件异常时抛出错误
- NONET : 在解析期间禁止任何网络连接.
可选项使用方式举例(通过块调用):
doc = Nokogiri::XML(File.open("blossom.xml")) do |config| config.strict.nonet end 或者
doc = Nokogiri::XML(File.open("blossom.xml")) do |config| config.options = Nokogiri::XML::ParseOptions::STRICT | Nokogiri::XML::ParseOptions::NONET end 解析
可以从文件,字符串,URL等来解析。靠的是这两个方法 Nokogiri::HTML, Nokogiri::XML:
读取字符串:
html_doc = Nokogiri::HTML("Mr. Belvedere Fan Club
") xml_doc = Nokogiri::XML("Alf ") 读取文件:
f = File.open("blossom.xml") doc = Nokogiri::XML(f) f.close 读取URL:
require 'open-uri' doc = Nokogiri::HTML(open("http://www.threescompany.com/")) 寻找节点
可以使用XPATH 以及 CSS selector 来搜索: 例如,给定一个XML:
Stars Moon
xpath:
@doc.xpath("//title") css:
@doc.css("book title") 修改节点内容
title = @doc.css("book title").firsto title.content = 'new title' puts @doc.to_html # => ... new title ... 修改节点的结构
first_title = @doc.at_css('title') second_book = @doc.css('book').last # 可以把第一个title放到第二个book中 first_title.parent = second_book # 也可以随意摆放。 second_book.add_next_sibling(first_title) # 也可以修改对应的class first_title.name = 'h2' first_title['class']='red_color' puts @doc.to_html # =>...
# 也可以新建一个node third_book = Nokogiri::XML::Node.new 'book', @doc third_book.content = 'I am the third book' second_book.add_next_sibling third_book puts @doc.to_html # => ... ... I am the third book 您可能感兴趣的文章:
相关内容
- Ruby中XML格式数据处理库REXML的使用方法指南_ruby专题_
- 实例解析Ruby程序中调用REXML来解析XML格式数据的用法_ruby专题_
- Ruby使用REXML库来解析xml格式数据的方法_ruby专题_
- Ruby实现网页图片抓取_ruby专题_
- 安装Ruby和安装Rails详细步骤详解_ruby专题_
- Ruby使用GDBM操作DBM数据存储方法实例详解_ruby专题_
- Ruby使用Mysql2连接操作MySQL_ruby专题_
- Ruby解析处理YAML和json格式数据_ruby专题_
- Ruby操作CSV格式数据方法详解_ruby专题_
- Ruby日期时间的比较,日期转换等时间日期处理方法大全_ruby专题_
