今回は正規表現を使って文字を抜き出したいと思います。
次回は正規表現を使って複数の文字を抜き出したいと思います。
まず、ボタンとテキストボックスをフォームに置きます。
テキストボックスには↓ココから
<li><a href="html/index.html">トップページ</a></li>
<li><a href="html/test.html">実験用テストページ</a></li>
<li><a href="hoge/index.html">テストのトップページ</a></li>
<li><a href="homu/homu.html">ほむほむ</a></li>
↑ココまで
を入れときます。
ボタン1のソースはこんな感じ
'. $ ^ { [ ( | ) * + ? を含む場合は、文字の前にをつける 例: (1)→((?<value>[0-9]*) '<li><a href="html/index.html">トップページ</a></li> Dim matchText = Regex.Match(TextBox1.Text, _ "<li><a href=""(?<url>.*)"">(?<text>.*)</a></li>") Console.WriteLine(matchText.Groups("url").Value) Console.WriteLine(matchText.Groups("text").Value) '↑↓どちらでもおk 'Console.WriteLine(matchText.Groups(1).Value) 'Console.WriteLine(matchText.Groups(2).Value)
実行すると…
html/index.html
トップページ
って出ますね、足りないですね!
このソースだと1つしか出せないのです。
どうでしたか?意外と簡単でしょ?
正規表現の書き方などは他のサイトを参考にしてください。