你好,欢迎来到电脑编程技巧与维护杂志社! 杂志社简介广告服务读者反馈编程社区  
合订本订阅
 
 
您的位置:杂志经典 / 网络与通信
Boost.Regex网页信息抽取(七)
 

CString CHtmlcodeIE::DeleteTag(CString HtmlCode)

{

    CString deletetag[]={" ","&amp","&lt","&gt","&quot","&copy",

        "\"","","&trade","&reg",""," ","   "," ","-","|","/",

        "","","...","\r","\n","·","#"};  //去除无用标记

    for(int i=0;i<sizeof(deletetag)/sizeof(deletetag[0]);i++)

    {

        HtmlCode.Replace(deletetag[i],"");

    }

while(HtmlCode.Find("  ")!=-1)

        HtmlCode.Replace("  ","");

    return HtmlCode;

}

3.2 主程序模块设计与实现

1)利用AppWizard新建一个工程“BoostRegex”,选择基于对话框的应用,其他可取默认值。

2)向对话框中添加三个文本编辑框控件,其ID号分别为IDC_EDIT1IDC_EDIT2IDC_EDIT3,在ClassWizard为编辑框控件添加关联字符串变量m_FileNamem_Sourcem_Extraction。在IDC_EDIT3Edit Properties中选中MultilineVertical scrollHorizontal scroll属性。

3)向对话框中添加六个Radio Button控件,其ID号为IDC_RADIO1-6,命名如图1所示,其中修改IDC_RADIO1的属性为GroupTab Stop,其他的属性只设置Tab Stop,这样保证6个单选按钮只能选择一个。


1 主程序界面

  推荐精品文章

·2024年12月目录 
·2024年11月目录 
·2024年10月目录 
·2024年9月目录 
·2024年8月目录 
·2024年7月目录 
·2024年6月目录 
·2024年5月目录 
·2024年4月目录 
·2024年3月目录 
·2024年2月目录 
·2024年1月目录
·2023年12月目录
·2023年11月目录

  联系方式
TEL:010-82561037
Fax: 010-82561614
QQ: 100164630
Mail:gaojian@comprg.com.cn

  友情链接
 
Copyright 2001-2010, www.comprg.com.cn, All Rights Reserved
京ICP备14022230号-1,电话/传真:010-82561037 82561614 ,Mail:gaojian@comprg.com.cn
地址:北京市海淀区远大路20号宝蓝大厦E座704,邮编:100089