Android WebView - отображать WebArchive

18

Веб-приложение Android имеет этот метод saveWebArchive с уровня API 11: Ссылка .

Он может сохранять целые веб-сайты в качестве веб-архивов, и это здорово! Но как получить загруженное содержимое обратно в веб-представление? Я попробовал

webview.loadUrl(Uri.fromFile(mywebarchivefile));

Но это отображает только xml на экране.

    
задан Jouke Waleson 13.10.2012 в 12:02
источник
  • Просмотрите мой ответ о том, как сохранить и загрузить архив для всех API здесь –  DeltaCap 30.11.2016 в 08:33

2 ответа

25

Обновление 21 февраля 2014 года

Мой ответ, размещенный ниже, не относится к файлам веб-архива, сохраненным в Android 4.4 KitKat и новее. Метод saveWebArchive () WebView под Android 4.4 «KitKat» (и, возможно, более новые версии тоже) не сохраняет веб-архив в XML-коде, который указан ниже. Вместо этого он сохраняет страницы в формате MHT (MHTML). Легко прочитать файлы .mht - просто используйте:

webView.loadUrl("file:///my_dir/mySavedWebPage.mht");

Все это намного проще, чем предыдущий метод, и совместим с другими платформами.

Ранее опубликовано

Мне это было нужно самому, и везде, где я искал, остались без ответа такие вопросы. Поэтому мне пришлось самому это разобраться. Ниже мой маленький класс WebArchiveReader и пример кода о том, как его использовать. Обратите внимание, что, несмотря на то, что Android-документы объявили, что mustInterceptRequest () был добавлен в WebViewClient в API11 (Honeycomb), этот код работает и успешно протестирован в эмуляторах Android до API8 (Froyo). Ниже приведен весь код, который необходим, я также загрузил полный проект в репозиторий GitHub по адресу Ссылка

Файл WebArchiveReader.java:

package com.hyperionics.war_test;

import android.util.Base64;
import android.webkit.WebResourceResponse;
import android.webkit.WebView;
import android.webkit.WebViewClient;
import org.w3c.dom.*;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.ByteArrayInputStream;
import java.io.InputStream;
import java.util.ArrayList;

public abstract class WebArchiveReader {
    private Document myDoc = null;
    private static boolean myLoadingArchive = false;
    private WebView myWebView = null;
    private ArrayList<String> urlList = new ArrayList<String>();
    private ArrayList<Element> urlNodes = new ArrayList<Element>();

    abstract void onFinished(WebView webView);

    public boolean readWebArchive(InputStream is) {
        DocumentBuilderFactory builderFactory =
                DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = null;
        myDoc = null;
        try {
            builder = builderFactory.newDocumentBuilder();
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        }
        try {
            myDoc = builder.parse(is);
            NodeList nl = myDoc.getElementsByTagName("url");
            for (int i = 0; i < nl.getLength(); i++) {
                Node nd = nl.item(i);
                if(nd instanceof Element) {
                    Element el = (Element) nd;
                    // siblings of el (url) are: mimeType, textEncoding, frameName, data
                    NodeList nodes = el.getChildNodes();
                    for (int j = 0; j < nodes.getLength(); j++) {
                        Node node = nodes.item(j);
                        if (node instanceof Text) {
                            String dt = ((Text)node).getData();
                            byte[] b = Base64.decode(dt, Base64.DEFAULT);
                            dt = new String(b);
                            urlList.add(dt);
                            urlNodes.add((Element) el.getParentNode());
                        }
                    }
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
            myDoc = null;
        }
        return myDoc != null;
    }

    private byte [] getElBytes(Element el, String childName) {
        try {
            Node kid = el.getFirstChild();
            while (kid != null) {
                if (childName.equals(kid.getNodeName())) {
                    Node nn = kid.getFirstChild();
                    if (nn instanceof Text) {
                        String dt = ((Text)nn).getData();
                        return Base64.decode(dt, Base64.DEFAULT);
                    }
                }
                kid = kid.getNextSibling();
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    public boolean loadToWebView(WebView v) {
        myWebView = v;
        v.setWebViewClient(new WebClient());
        WebSettings webSettings = v.getSettings();
        webSettings.setDefaultTextEncodingName("UTF-8");

        myLoadingArchive = true;
        try {
            // Find the first ArchiveResource in myDoc, should be <ArchiveResource>
            Element ar = (Element) myDoc.getDocumentElement().getFirstChild().getFirstChild();
            byte b[] = getElBytes(ar, "data");

            // Find out the web page charset encoding
            String charset = null;
            String topHtml = new String(b).toLowerCase();
            int n1 = topHtml.indexOf("<meta http-equiv=\"content-type\"");
            if (n1 > -1) {
                int n2 = topHtml.indexOf('>', n1);
                if (n2 > -1) {
                    String tag = topHtml.substring(n1, n2);
                    n1 = tag.indexOf("charset");
                    if (n1 > -1) {
                        tag = tag.substring(n1);
                        n1 = tag.indexOf('=');
                        if (n1 > -1) {
                            tag = tag.substring(n1+1);
                            tag = tag.trim();
                            n1 = tag.indexOf('\"');
                            if (n1 < 0)
                                n1 = tag.indexOf('\'');
                            if (n1 > -1) {
                                charset = tag.substring(0, n1).trim();
                            }
                        }
                    }
                }
            }

            if (charset != null)
                topHtml = new String(b, charset);
            else
                topHtml = new String(b);
            String baseUrl = new String(getElBytes(ar, "url"));
            v.loadDataWithBaseURL(baseUrl, topHtml, "text/html", "UTF-8", null);
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }
        return true;
    }

    private class WebClient extends WebViewClient {
        @Override
        public WebResourceResponse shouldInterceptRequest(WebView view, String url) {
            if (!myLoadingArchive)
                return null;
            int n = urlList.indexOf(url);
            if (n < 0)
                return null;
            Element parentEl = urlNodes.get(n);
            byte [] b = getElBytes(parentEl, "mimeType");
            String mimeType = b == null ? "text/html" : new String(b);
            b = getElBytes(parentEl, "textEncoding");
            String encoding = b == null ? "UTF-8" : new String(b);
            b = getElBytes(parentEl, "data");
            return new WebResourceResponse(mimeType, encoding, new ByteArrayInputStream(b));
        }

        @Override
        public void onPageFinished(WebView view, String url)
        {
            // our WebClient is no longer needed in view
            view.setWebViewClient(null);
            myLoadingArchive = false;
            onFinished(myWebView);
        }
    }
}

Вот как использовать этот класс, образец класса MyActivity.java:

package com.hyperionics.war_test;

import android.app.Activity;
import android.os.Bundle;
import android.webkit.WebView;
import android.webkit.WebViewClient;
import java.io.IOException;
import java.io.InputStream;

public class MyActivity extends Activity {

    // Sample WebViewClient in case it was needed...
    // See continueWhenLoaded() sample function for the best place to set it on our webView
    private class MyWebClient extends WebViewClient {
        @Override
        public void onPageFinished(WebView view, String url)
        {
            Lt.d("Web page loaded: " + url);
        }
    }

    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);
        WebView webView = (WebView) findViewById(R.id.webView);
        try {
            InputStream is = getAssets().open("TestHtmlArchive.xml");
            WebArchiveReader wr = new WebArchiveReader() {
                void onFinished(WebView v) {
                    // we are notified here when the page is fully loaded.
                    continueWhenLoaded(v);
                }
            };
            // To read from a file instead of an asset, use:
            // FileInputStream is = new FileInputStream(fileName);
            if (wr.readWebArchive(is)) {
                wr.loadToWebView(webView);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    void continueWhenLoaded(WebView webView) {
        Lt.d("Page from WebArchive fully loaded.");
        // If you need to set your own WebViewClient, do it here,
        // after the WebArchive was fully loaded:
        webView.setWebViewClient(new MyWebClient());
        // Any other code we need to execute after loading a page from a WebArchive...
    }
}

Чтобы все было в порядке, вот мой маленький класс Lt.java для вывода отладки:

package com.hyperionics.war_test;

import android.util.Log;

public class Lt {
    private static String myTag = "war_test";
    private Lt() {}
    static void setTag(String tag) { myTag = tag; }
    public static void d(String msg) {
        // Uncomment line below to turn on debug output
        Log.d(myTag, msg == null ? "(null)" : msg);
    }
    public static void df(String msg) {
        // Forced output, do not comment out - for exceptions etc.
        Log.d(myTag, msg == null ? "(null)" : msg);
    }
}

Надеюсь, что это будет полезно.

Обновление 19 июля 2013 г.

Некоторые веб-страницы не имеют метатега, определяющего текстовое кодирование, а затем код, который мы показываем выше, не отображает символы правильно. В версии этого кода GitHub я теперь добавил алгоритм обнаружения набора символов, который догадывается о кодировании в таких случаях. Опять же, см. Ссылка

Грег     

ответ дан gregko 19.11.2012 в 00:34
источник
  • Фантастический! Я надеялся, что будет встроенное решение, но этого недостаточно, это кажется твердой альтернативой. Благодаря! –  Jouke Waleson 20.11.2012 в 08:12
  • Спасибо, Жук! Я рад, что смог опубликовать что-то полезное. Я также загрузил образец проекта в github: github.com/gregko/WebArchiveReader –  gregko 25.11.2012 в 14:39
  • спасибо за ваш ответ, но saveWebArchive доступен с api 11, я хочу поддержать сохранение формы веб-страницы api 8 и выше. Пожалуйста, помогите мне, если у вас есть какое-либо решение по этому поводу. Я видел, как ваш код работает нормально –  Antarix 14.05.2013 в 12:17
  • На самом деле мой код, указанный выше, не использует saveWebArchive (), поэтому его можно использовать даже в API 8 для чтения архивов, сохраненных в другом месте. У меня нет хорошего решения для saveWebArchive () на старых платформах, кроме просмотра исходного кода Android WebView, чтобы узнать, можно ли скопировать и адаптировать код для этой функции для старых платформ самостоятельно. Если вам это удастся, отправьте его нам всем! –  gregko 14.05.2013 в 18:02
  • @gregko спасибо, ваш проект git действительно полезен, вы сэкономили много времени :) –  Tombeau 28.11.2013 в 05:36
Показать остальные комментарии
17

Я нашел недокументированный способ чтения сохраненного webarchive. Просто выполните:

String raw_data = (read the mywebarchivefile as a string)

, а затем вызовите

webview.loadDataWithBaseURL(mywebarchivefile, raw_data, "application/x-webarchive-xml", "UTF-8", null);

Ссылка: Ссылка

Доступен с Android 3.0, уровень api 11.

    
ответ дан Tomasz Jarosik 20.11.2013 в 01:06
источник
  • Это работало как прелесть для меня. Спасибо за это. –  Espen Riskedal 14.12.2013 в 17:31
  • Я знаю, что это старый пост, но это отлично поработало для меня с помощью Xamarin Android и, слава богу, так как я действительно не хотел сначала превращать архив в кодировку, отличную от base64! –  hvaughan3 01.12.2015 в 00:20
  • Это сработало для меня после того, как я заменил «application / x-webarchive-xml» на «multipart / related», который, кажется, является правильным типом в архивах нового формата. Но веб-просмотр зависает после показа архива из-за ошибки с javascripts - stackoverflow.com/questions/27986868/... –  Stan 12.02.2016 в 13:00