Contente
Ler arquivos HTML no Java não é diferente de ler arquivos de texto. A não ser que o formato do arquivo seja XML, é possível ler um arquivo HTML usando um objeto arquivo Java. Ele importa o texto do arquivo e o lê, linha por linha. Você pode manipular o texto, ou mostrá-lo na tela. Usar o objeto arquivo para ler HTML é possível usando apenas algumas linhas de código.
Instruções
Programar em Java é tão fácil quanto fazer um café java! (java hot and black image by Pix by Marti from Fotolia.com)-
Importe as bibliotecas necessárias. O uso do objeto arquivo requer o uso de bibliotecas além das importadas automaticamente quando você cria uma nova classe ou projeto. O código a seguir mostra quais bibliotecas você irá precisar:
import java.io.BufferedInputStream; import java.io.DataInputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException;
-
Abra o arquivo e prepare os buffers. O objeto precisa da localização do arquivo HTML dentro do computador. Ele pode também estar em um servidor web. O código a seguir estabelece uma variável para abrir o arquivo e cria outras para o fluxo de dados.
File myhtml = new File("C:myHTML.html"); FileInputStream fileinput = null; BufferedInputStream mybuffer = null; DataInputStream datainput = null;
-
Atribua as informações sobre o arquivo nas variáveis criadas. As variáveis de buffer carregam a informação para a memória para serem lidas mais rapidamente.
fileinput = new FileInputStream(myhtml); mybuffer = new BufferedInputStream(fileinput); datainput = new DataInputStream(mybuffer);
-
Crie um loop que lê o arquivo linha por linha e o imprime para o console. O código a seguir lê os dados até chegar ao fim do fluxo:
while (datainput.available() != 0) { System.out.println(datainput.readLine()) GO }
-
Feche o fluxo de arquivo. Para liberar memória, é importante fechar os fluxos de arquivos e de dados:
myHTML.close(); mybuffer.close(); datainput.close();