Рубрики
Без рубрики

Спуп – Получить значок с html-страницы

– Jsoup – Получить значок с html-страницы

Существует множество способов распознавания значка в веб-браузере:

Пример 1

  
	
  

Пример 2

  
	
  

Пример 3 – странно, но Google использует его.

  
	
  

1. Пример Jsoup

Фрагменты кода, чтобы подняться выше favicon с помощью Jsoup.

  
	Element element = doc.head().select("link[href~=.*\\.(ico|png)]").first();
	System.out.println(element.attr("href"));
	Element element = doc.head().select("meta[itemprop=image]").first();
	System.out.println(element.attr("content"));

2. Модульный тест

Пример модульного теста.

package com.webmitta.analysis;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.testng.Assert;
import org.testng.annotations.Test;

@Test
public class TestFavIcon {

  Document document;

  private String PageProvider1() {

	StringBuffer html = new StringBuffer();

	html.append("
");
	html.append("");
	html.append("");
	html.append("");
	html.append("");
	html.append("");
	html.append("something");
	html.append("");
	html.append("");

	return html.toString();

  }

  private String PageProvider2() {

	StringBuffer html = new StringBuffer();

	html.append("
");
	html.append("");
	html.append("");
	html.append("");
	html.append("");
	html.append("");
	html.append("something");
	html.append("");
	html.append("");

	return html.toString();
  }

  @Test
  void test_FavIcon1() {

	Document doc = Jsoup.parse(PageProvider1());

	Element element = doc.head().select("link[href~=.*\\.(ico|png)]").first();
	Assert.assertEquals(element.attr("href"),
		"http://example.com/image.ico");

  }

  @Test
  void test_FavIcon2() {

	Document doc = Jsoup.parse(PageProvider2());

	Element element = doc.head().select("meta[itemprop=image]").first();
	Assert.assertEquals(element.attr("content"),
		"/images/google_favicon_128.png");

  }

}

Выход

[TestNG] Running:
  C:\Users\mkyong2002\AppData\Local\Temp\testng-eclipse--1846902117\testng-customsuite.xml

PASSED: test_FavIcon1
PASSED: test_FavIcon2

Рекомендации

  1. Википедия: Фавикон
  2. Синтаксический анализатор HTML Jsoup Примеры Hello World

Оригинал: “https://mkyong.com/java/jsoup-get-favicon-from-html-page/”