C#如何解析http报文

 更新时间:2015年08月04日 11:35:27   投稿:mrr  
这篇文章如果讲解了用C#如何解析http报文,要解析http报文,需要哪些操作呢?下面小编给大家整理相关资料,需要的朋友可以参考下

下面通过一段内容有文字说明有代码分析,并附有展示图供大家学习。

要解析HTTP报文,需要实现以下操作:

读取HTTP报头提供的各种属性
分析属性值,从中获取内容编码和字符集编码
将报头数据和内容进行分离
判断内容是否文本还是二进制,如果是二进制的则不进行处理
如果内容是文本,按报头中提供的内容编码和字符集编码进行解压缩和解码
目前没有找到.Net框架内置的解析方法,理论上HttpClient等类在内部应该已经实现了解析,但不知为何没有公开这些处理方法。(亦或是我没找到)

那么只能自己来解析这些数据了。

我们先来看看这个经过gzip压缩的文本内容的HTTP报文:

这里提供一个老外写的简陋的解析类(已经过修改,原代码中存在一些严重BUG):

public enum HTTPHeaderField
{
 Accept = 0,
 Accept_Charset = 1,
 Accept_Encoding = 2,
 Accept_Language = 3,
 Accept_Ranges = 4,
 Authorization = 5,
 Cache_Control = 6,
 Connection = 7,
 Cookie = 8,
 Content_Length = 9,
 Content_Type = 10,
 Date = 11,
 Expect = 12,
 From = 13,
 Host = 14,
 If_Match = 15,
 If_Modified_Since = 16,
 If_None_Match = 17,
 If_Range = 18,
 If_Unmodified_Since = 19,
 Max_Forwards = 20,
 Pragma = 21,
 Proxy_Authorization = 22,
 Range = 23,
 Referer = 24,
 TE = 25,
 Upgrade = 26,
 User_Agent = 27,
 Via = 28,
 Warn = 29,
 Age = 30,
 Allow = 31,
 Content_Encoding = 32,
 Content_Language = 33,
 Content_Location = 34,
 Content_Disposition = 35,
 Content_MD5 = 36,
 Content_Range = 37,
 ETag = 38,
 Expires = 39,
 Last_Modified = 40,
 Location = 41,
 Proxy_Authenticate = 42,
 Refresh = 43,
 Retry_After = 44,
 Server = 45,
 Set_Cookie = 46,
 Trailer = 47,
 Transfer_Encoding = 48,
 Vary = 49,
 Warning = 50,
 WWW_Authenticate = 51
};
class HTTPHeader
{
 #region PROPERTIES
 private string[] m_StrHTTPField = new string[52];
 private byte[] m_byteData = new byte[4096];
 public string[] HTTPField
 {
  get { return m_StrHTTPField; }
  set { m_StrHTTPField = value; }
 }
 public byte[] Data
 {
  get { return m_byteData; }
  set { m_byteData = value; }
 }
 #endregion
 // convertion
 System.Text.ASCIIEncoding encoding = new System.Text.ASCIIEncoding();
 #region CONSTRUCTEUR
 /// <summary>
 /// Constructeur par défaut - non utilisé
 /// </summary>
 private HTTPHeader()
 { }
 public HTTPHeader(byte[] ByteHTTPRequest)
 {
  string HTTPRequest = encoding.GetString(ByteHTTPRequest);
  try
  {
   int IndexHeaderEnd;
   string Header;
   // Si la taille de requête est supérieur ou égale à 1460, alors toutes la chaine est l'entête http
   if (HTTPRequest.Length <= 1460)
    Header = HTTPRequest;
   else
   {
    IndexHeaderEnd = HTTPRequest.IndexOf("\r\n\r\n");
    Header = HTTPRequest.Substring(0, IndexHeaderEnd);
    Data = ByteHTTPRequest.Skip(IndexHeaderEnd + 4).ToArray();
   }
   HTTPHeaderParse(Header);
  }
  catch (Exception)
  { }
 }
 #endregion
 #region METHODES
 private void HTTPHeaderParse(string Header)
 {
  #region HTTP HEADER REQUEST & RESPONSE
  HTTPHeaderField HHField;
  string HTTPfield, buffer;
  int Index;
  foreach (int IndexHTTPfield in Enum.GetValues(typeof(HTTPHeaderField)))
  {
   HHField = (HTTPHeaderField)IndexHTTPfield;
   HTTPfield = "\n" + HHField.ToString().Replace('_', '-') + ": "; //Ajout de \n devant pour éviter les doublons entre cookie et set_cookie
   // Si le champ n'est pas présent dans la requête, on passe au champ suivant
   Index = Header.IndexOf(HTTPfield);
   if (Index == -1)
    continue;
   buffer = Header.Substring(Index + HTTPfield.Length);
   Index = buffer.IndexOf("\r\n");
   if (Index == -1)
    m_StrHTTPField[IndexHTTPfield] = buffer.Trim();
   else
    m_StrHTTPField[IndexHTTPfield] = buffer.Substring(0, Index).Trim();
   //Console.WriteLine("Index = " + IndexHTTPfield + " | champ = " + HTTPfield.Substring(1) + " " + m_StrHTTPField[IndexHTTPfield]);
  }
  // Affichage de tout les champs
  /*for (int j = 0; j < m_StrHTTPField.Length; j++)
  {
   HHField = (HTTPHeaderField)j;
   Console.WriteLine("m_StrHTTPField[" + j + "]; " + HHField + " = " + m_StrHTTPField[j]);
  }
  */
  #endregion
 }
 #endregion
}

编写以下代码以实现解析文件:

class Program
{
 static void Main(string[] args)
 {
  SRART: Console.WriteLine("输入待解析的HTTP报文数据文件完整路径:");
  var filename = Console.ReadLine();
  try
  {
   FileStream fs = new FileStream(filename, FileMode.Open);
   BinaryReader br = new BinaryReader(fs);
   var data = br.ReadBytes((int)fs.Length);
   var header = new HTTPHeader(data);
   var x = 0;
   foreach (var f in header.HTTPField)
   {
    if (!String.IsNullOrEmpty(f))
    {
     Console.WriteLine($"[{x:00}] - {(HTTPHeaderField) x} : {f}");
    }
    x++;
   }
   Console.WriteLine($"总数据尺寸{fs.Length}字节,实际数据尺寸{header.Data.Length}字节");
   Console.WriteLine(Encoding.UTF8.GetString(header.Data));
   Console.WriteLine();
   br.Close();
   fs.Close();  
  }
  catch (Exception e)
  {
   Console.WriteLine(e);
  }
  goto SRART;
 }
}

这里还未实现gzip解压缩和字符解码,直接用UTF8解码输出的。(需要时再写吧,都是体力活儿~)

效果图展示:

下面的图是没有经过gzip压缩过的数据。

以上就是用C#如何解析http报文的全部内容,哪位大侠还有好的方法欢迎提出宝贵意见,喜欢大家喜欢以上内容所述。

相关文章

  • 在winform下实现左右布局多窗口界面的方法之续篇

    在winform下实现左右布局多窗口界面的方法之续篇

    这篇文章主要介绍了在winform下实现左右布局多窗口界面的方法之续篇 的相关资料,需要的朋友可以参考下
    2016-02-02
  • WPF模拟实现Gitee泡泡菜单的示例代码

    WPF模拟实现Gitee泡泡菜单的示例代码

    这篇文章主要介绍了如何利用WPF模拟实现Gitee泡泡菜单,文中的示例代码讲解详细,对我们学习或工作有一定帮助,需要的可以参考一下
    2022-08-08
  • 简单记录C# 条件编译

    简单记录C# 条件编译

    条件编译是C#比Java多出的东西,但我跟前辈请教后,他们都说条件编译在实际的项目开发中不怎么使用.下面仅仅是将步奏记录下来,有需要的小伙伴可以参考下。
    2015-06-06
  • 详解C#设计模式编程中的模板方法模式使用

    详解C#设计模式编程中的模板方法模式使用

    这篇文章主要介绍了C#设计模式编程中的模板方法模式,模板方法模式比较好理解,即设定好算法骨架以后进行代码的反复利用,需要的朋友可以参考下
    2016-02-02
  • C#实现将javascript文件编译成dll文件的方法

    C#实现将javascript文件编译成dll文件的方法

    这篇文章主要介绍了C#实现将javascript文件编译成dll文件的方法,涉及C#编译生成dll动态链接库文件的实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-11-11
  • 基于C#动手实现网络服务器Web Server

    基于C#动手实现网络服务器Web Server

    这篇文章主要为大家详细介绍了基于C#动手实现网络服务器Web Server,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-10-10
  • C#线程队列用法实例分析

    C#线程队列用法实例分析

    这篇文章主要介绍了C#线程队列用法,以实例形式分析了C#线程队列的创建、运行、等待、结束等操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-09-09
  • c# 获得本地ip地址的三种方法

    c# 获得本地ip地址的三种方法

    这篇文章主要介绍了c# 获得本地ip地址的三种方法,帮助大家更好的理解和实用c#,感兴趣的朋友可以了解下
    2020-12-12
  • C#编程和Visual Studio使用技巧(上)

    C#编程和Visual Studio使用技巧(上)

    C#是一门伟大的编程语言,与C++和Java相比,它的语法更简单,相对来说更好入门。Visual Studio作为.Net平台上最重量级的IDE,也通过不断的更新为开发者带来更出色的开发体验。本文将介绍10个C#编程和Visual Studio IDE使用技巧。
    2015-10-10
  • C#实现归并排序

    C#实现归并排序

    这篇文章介绍了C#实现归并排序的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-04-04

最新评论