댓글 검색 목록

[Nodejs] XML 파일 스크래핑 및 해당 데이터 요소에 액세스

페이지 정보

작성자 운영자 작성일 20-08-02 10:14 조회 601 댓글 0

NODE.JS : 제공된 URL에서 XML 파일을 다운로드하고 해당 데이터 요소를 읽는 중입니다.


https://www.monkwhocode.com/2020/07/nodejs-downloading-xml-file-from-given.html 


이 기사에서는 주어진 URL에서 XML 파일을 다운로드하는 방법을 살펴 봅니다. 그런 다음 해당 요소에 액세스하십시오.


예를 들어 XML 파일 또는 여러 파일로 된 데이터가 있는 사이트에서 데이터를 스크랩 하는 등의 경우에 많이 사용할 수 있습니다.

이 기사는 꽤 짧으며 대부분 자체 설명 코드입니다.


또한 오늘날 데이터가 새로운 오일이므로 데이터 스크랩에서 많은 프리랜서 일자리를 얻을 수 있으므로 도움이 될 수 있습니다.


코드부터 시작하겠습니다.


var fs = require('fs')
var https = require('https');//For accessing https url we need this module instead of http.
var xml2js = require('xml2js');//Required for xml parsing.
var file_name = 'data.xml'//This will be the name of file we will be generating.
var DOWNLOAD_DIR =__dirname+'/';

*/
This function reads data from URL and writes data into new file
with respect to the given name and directory path.
*/

function download(){
 var file_url='https://www.w3schools.com/xml/note.xml'
var file =

fs.createWriteStream(DOWNLOAD_DIR +file_name,{'flags': 'w'});
 const request = https.get(file_url, function(response) {
 response.pipe(file);
 });
}

*/
This function reads data from the XML file and parses it into JSON format to access its elements.
*/
function read(){
 var fileData = fs.readFileSync(file_name, 'ascii');
 var parser = new xml2js.Parser();
 parser.parseString(fileData.substring(0, fileData.length), function (err, result) {
   console.log(result)//Here you will get data in json format.
 }); 
}
 


Note:


1) Node.js에서 __dirname은 항상 현재 실행 중인 스크립트가 있는 디렉토리입니다. 따라서 /A1/A2/script.js에 __dirname을 입력하면 값은 / A1 / A2가됩니다.


2) pipe() 함수는 사용 가능 해지면 읽을 수 있는 스트림에서 데이터를 읽고 대상 쓰기 가능 스트림에 씁니다. 코드 변수 파일에는 쓰기 가능한 스트림이 있고 응답은 읽을 수 있는 스트림입니다. 이것은 node.js 개발자 프로필에 대한 가장 많이 묻는 인터뷰 질문이기도 합니다.



댓글목록 0

등록된 댓글이 없습니다.

웹학교 로고

온라인 코딩학교

코리아뉴스 2001 - , All right reserved.