找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 288|回复: 0
打印 上一主题 下一主题

php解析mht文件转换成html的实例

[复制链接]

2500

主题

2513

帖子

7520

积分

论坛元老

Rank: 8Rank: 8

积分
7520
跳转到指定楼层
楼主
发表于 2018-2-14 05:27:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

            php解析mht文件,使用编辑器打开可以看到base64编码所以,mht是可以转换成html的。
set_file ( $filename );
                $o_mhtml->extract ();
                return $o_mhtml->get_part_to_file(0);
        }
        return null;
}
function mhtmlParseAll($filename) {
        if (file_exists ( $filename )) {
                if (is_dir ( $filename )) return false;
                $filename = strtolower ( $filename );
                if (strpos ( $filename, '.mht', 1 ) == FALSE) return false;
                       
                $o_mhtml = new mhtml ();
                $o_mhtml->set_file ( $filename );
                $o_mhtml->extract ();
                return $o_mhtml->get_all_part_file();
        }
        return null;
}
*/
class mhtparse {
        var $file = '';
        var $boundary = '';
        var $filedata = '';
        var $countparts = 1;
        var $log = '';
       
        function extract() {
                $this->read_filedata ();
                $this->file_parts ();
                return 1;
        }
       
        function set_file($p) {
                $this->file = $p;
        }
       
        function get_log() {
                return $this->log;
        }
       
        function file_parts() {
                $lines = explode ( "\n", substr ( $this->filedata, 0, 8192 ) );
                foreach ( $lines as $line ) {
                        $line = trim ( $line );
                        if (strpos ( $line, '=' ) !== FALSE) {
                                if (strpos ( $line, 'boundary', 0 ) !== FALSE) {
                                        $range = $this->getrange ( $line, '"', '"', 0 );
                                        $this->boundary = "--" . $range ['range'];
                                        $this->filedata = str_replace ( $line, '', $this->filedata );
                                        break;
                                }
                        }
                }
                if ($this->boundary != '') {
                        $this->filedata = explode ( $this->boundary, $this->filedata );
                        unset ( $this->filedata [0] );
                        $this->filedata = array_values ( $this->filedata );
                        $this->countparts = count ( $this->filedata );
                } else {
                        $tmp = $this->filedata;
                        $this->filedata = array (
                                        $tmp
                        );
                }
        }
       
        function get_all_part_file() {
                return $this->filedata;
        }
       
        function get_part_to_file($i) {
                $line_data_start = 0;
                $encoding = '';
                $part_lines = explode ( "\n", ltrim ( $this->filedata [$i] ) );
                foreach ( $part_lines as $line_id => $line ) {
                        $line = trim ( $line );
                        if ($line == '') {
                                if (trim ( $part_lines [0] ) == '--')
                                        return 1;
                                $line_data_start = $line_id;
                                break;
                        }
                        if (strpos ( $line, ':' ) !== FALSE) {
                                $pos = strpos ( $line, ':' );
                                $k = strtolower ( trim ( substr ( $line, 0, $pos ) ) );
                                $v = trim ( substr ( $line, $pos + 1, strlen ( $line ) ) );
                                if ($k == 'content-transfer-encoding') {
                                        $encoding = $v;
                                }
                                if ($k == 'content-location') {
                                        $location = $v;
                                }
                                if ($k == 'content-type') {
                                        $contenttype = $v;
                                }
                        }
                }
               
                foreach ( $part_lines as $line_id => $line ) {
                        if ($line_id file, 'r' );
                $this->filedata = fread ( $handle, filesize ( $this->file ) );
                fclose ( $handle );
        }
       
        function getrange(&$subject, $Beginmark_str = '{', $Endmark_str = '}', $Start_pos = 0) {
                /*
                 * $str="sssss { x { xx } {xx{xx } x} x} sssss"; $range=string::getRange($str,'{','}',0); echo $range['range']; //tulem: " x { xx } {xx{xx } x} x" echo $range['behin']; //tulem: 6 echo $range['end']; //tulem: 30 (' ') -- l5pumärgist järgnev out: array('range'=>$Range,'begin'=>$Begin_firstOccurence_pos,'end'=>$End_sequel_pos) | false v1.1 2004-2006,Uku-Kaarel J5esaar,ukjoesaar@hot.ee,http://www.hot.ee/ukjoesaar,+3725110693
                 */
                if (empty ( $Beginmark_str ))
                        $Beginmark_str = '{';
                $Beginmark_str_len = strlen ( $Beginmark_str );
               
                if (empty ( $Endmark_str ))
                        $Endmark_str = '}';
                $Endmark_str_len = strlen ( $Endmark_str );
               
                /* $Start_pos_cache = 0; */
                do {
                        /* !algus */
                        if (! is_int ( $Begin_firstOccurence_pos ))
                                $Start_pos_cache = $Start_pos;
                               
                                /* ?algus-test */
                        $Start_pos_cache = @strpos ( $subject, $Beginmark_str, $Start_pos_cache );
                       
                        /* this is possible start for range */
                        if (is_int ( $Start_pos_cache )) {
                                /* skip */
                                $Start_pos_cache = ($Start_pos_cache + $Beginmark_str_len);
                                /* test possible range start pos */
                                if (is_int ( $Begin_firstOccurence_pos )) {
                                        if ($Start_pos_cache  $range_end_pos)
                                                $rangeClean = 1;
                                }
                                /* here it is */
                                if (! is_int ( $Begin_firstOccurence_pos ))
                                        $Begin_firstOccurence_pos = $Start_pos_cache;
                        } /* VIGA NR 0 ALGUST EI OLE */
                       
                        if (! is_int ( $Start_pos_cache )) {
                                /* !algus */
        /* VIGA NR 1 ALGUSMARKI EI LEITUD : VIIMANE VOIMALIK ALGUS */
        if (is_int ( $Begin_firstOccurence_pos ) and ($Start_pos_cache  $Range,
                                'begin' => $Begin_firstOccurence_pos,
                                'end' => $End_sequel_pos
                );
        } // end getrange()
} // class
?>
以上这篇php解析mht文件转换成html的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
            
            
您可能感兴趣的文章:
  • php生成html文件方法总结
  • php实现转换html格式为文本格式的方法
  • PHP转换文本框内容为HTML格式的方法
            
  • 分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用户反馈
    客户端