[펄 (Perl)] HTML Entity(문자 참조)를 일반 문자로 변환하기
HTML 파일 안에는 HTML Entity라고 불리는(우리말로는 '문자 참조') 구조가 있습니다. 예를 들어 &이라는 문자는 HTML 파일 안에서 &로 씁니다. HTML 파일 안에 &라고 적혀 있으면 웹브라우저가 &라고 표시해주는 것입니다.
문제는 그러한 HTML 파일을 펄에서 바로 읽어버리면 &로 표시되지 않고 &라고 있는 그대로 표시되어버린다는 데에 있습니다. 이를 해결하려면 다음과 같이 하면 됩니다.
#!/usr/bin/perl
use 5.012;
use strict;
use warnings;
use HTML::Entities;
my $test = '&';
say $test; # &라고 출력됩니다.
say decode_entities($test); # &라고 변환되어 출력됩니다.
'개발, 전산, AI, IT' 카테고리의 다른 글
[펄 (Perl)] 배열에 특정 값이 있는지 검사하기 (0) | 2018.08.13 |
---|---|
[리눅스] 특정 디렉토리 내 파일 개수 보기 (0) | 2018.08.13 |
[펄 (Perl)] 웹사이트 긁어오기 (0) | 2018.08.13 |
[안드로이드] no original dex files found for dex location (0) | 2018.08.02 |
[안드로이드] undefined reference to `cv::imwrite(cv::String const&, cv::_InputArray const&, std::__ndk1::vector<int, std::__ndk1::allocator<int> > const&)' (2) | 2018.07.20 |