Java에서 String에 포함된 HTML 태그 제거하기(정규식 사용 X)
에디터에서 문서를 작성하고, 서버로 텍스트를 전달한다면 기본적으로 HTML태그들이 포함되서 넘어오게 된다. 하지만 데이터 분석을 위해서는 HTML태그를 제거한 순수 텍스트에 대한 정보가 필요하다. 슬프게도 자바 혹은 스프링에서 자체적으로 HTML태그를 뚝딱 제거하는 기능이 없다 ㅠ 굳이 방법이 있다면, 정규식을 이용하는건데 이 방법은 별로 추천하고 싶지 않은 방법이다. (정규식을 정교하게 짜지 않는다면, 사용자가 실수로 넣은 기호들이 제거될 수도 있다) 당연한 이야지만 정규식을 사용하지 않고 HTML 태그를 제거하는 방법이 있다. JSoup라는 라이브러리인데, 이 라이브러리를 이용해 HTML 태그를 제거하는 방법을 소개하고자한다. JSoup JSoup은 HTML 문서에 저장된 데이터를 구문 분석, 추출 ..
개발/JAVA
2023. 6. 22. 17:46
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- AWS
- ChatGPT
- elasticsearch
- GIT
- java
- EKS
- Kotlin
- 후쿠오카
- serverless
- 티스토리챌린지
- 람다
- CloudFront
- docker
- springboot
- OpenFeign
- Spring
- 오블완
- cache
- Log
- terraform
- openAI API
- Elastic cloud
- MySQL
- AOP
- lambda
- JWT
- OpenAI
- S3
- AWS EC2
- 스프링부트
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함