Daniel Prado Rodríguez Visita: CocinaTusRecetas o de Guía turística de Nueva York 
  Miércoles, 22 de Noviembre de 2017 Inicio | Contactar
Añadir a favoritos | Imprimir 
  Volver al resto de artículos JAVA


Programación JAVA - Capturador de páginas HTML en objetos String o en archivos

» Programacion » Java » Capturador de páginas HTML en objetos String o en archivos
Viernes, 2 de Diciembre de 2005. Escrito por admin


Capturador de páginas HTML en un objeto String
En primer lugar se muestra una clase de utilería con el código necesario para capturar una página html e introducirla en un objeto String.
Esto puede ser muy interesante para poder obtener información actualizada de otras páginas, como puede ser la captura de noticias u otros elementos colgados en internet para su posterior tratamiento e inserción en nuestra propia página.

package WebToString;

import java.net.*;

import java.io.*;

public class WebToString {

     public static String convert (String myUrl)

    {

        URL url;

        BufferedReader stream;

        String aux = "";

        String l;

        try{ 

              url= new URL(myUrl);

              stream = new BufferedReader (new InputStreamReader (url.openStream()));

              while ((l=stream.readLine())!=null)

              {aux+=l; }

           }

        catch (Exception e)

           {

              System.out.print("Error al capturar una página para convertirla a un objeto String: "+ e);

           }            

        return aux;

      }   

}

Capturador de páginas HTML en un archivo

Este codigo nos muestra una funcionalidad parecida al anterior pero además nos almacena la página en un archivo. Se trata de una aplicación JAVA y no de una clase de utilería como la anterior.

import java.net.*;

import java.io.*;

public class getPage

{

     public static void main(String[] arg)

     {

          String un;

          try {un=arg[0];}

          catch (ArrayIndexOutOfBoundsException e)

          {

             un="http://www.cocinatusrecetas.com";

             System.out.println("Ninguna URL definida, cojo "+un);

          };

          System.out.println("URL:"+un);

          URL url;

          boolean tribilín=false;

          try {url= new URL(un);}

          catch (MalformedURLException e)

          {

             System.out.println("URL equivocado, cojo http://www.cocinatusrecetas.com");

             url = null;

             tribilín=true;

          };

          if (tribilín)

              try {url = new URL ("http://www.cocinatusrecetas.com");}

             catch (MalformedURLException e){};

         BufferedReader stream;

         try {stream = new BufferedReader (new InputStreamReader (url.openStream()));}

         catch (IOException e){

         System.out.println("Error de apertura del archivo");

         stream=null;

         System.exit(0);

         };

         File out=new File(".\\"+url.getFile());

         FileWriter Output;

         try {Output=new FileWriter(out);}

         catch (IOException e) {Output=null;};

         String l;

         try

         {

             while ((l=stream.readLine())!=null)

             {

                 Output.write(l);

             };

            Output.flush();

            Output.close();

        }

        catch (IOException e){System.out.println("Error de lectura.");};

    }

}

 

 

comentarios (2)
Siguiente artículo JAVA 

COMENTARIOS EN FACEBOOK SOBRE: Artículo JAVA (J2EE) - Capturador de páginas HTML en objetos String o en archivos
 
Mapa web |  Ir a la página principal  | Ir a Blog de Recetas | http://www.recetasdepescado.net | Política de privacidad | Política de cookies
www.daniel.prado.name - Página Personal - © Copyright