Карта сайта Kansoftware
НОВОСТИУСЛУГИРЕШЕНИЯКОНТАКТЫ
KANSoftWare

Разбиение текста на слова и получение количества слов в тексте

Delphi , Синтаксис , Текст и Строки



Автор: 777
WEB-сайт: http://delphibase.endimus.com

{ **** UBPFD *********** by delphibase.endimus.com ****
>> Разбиение текста на слова + получение количества слов в тексте

T : Собственно строка, которая будет разбиваться на слова
Mode: Режим, может быть
0: получение английских и русских слов
1: только русских
2: только английских
List: Здесь хранятся найденые слова (по умолчанию = nil)

возвращаемое значение: количество слов.

P/S
По идейным соображениям специальные символы, цифры
и пробелы игнорируются.

Зависимости: Windows, Classes
Автор:       777, nix@rbcmail.ru, Архангельск
Copyright:   777
Дата:        15 июня 2002 г.
***************************************************** }

function StringToWords(T: string; Mode: Short; List: Tstrings = nil): integer;
var
  i, z: integer;
  s: string;
  c: Char;

  procedure Check;
  begin
    if (s > '') and (List <> nil) then
    begin
      List.Add(S);
      z := z + 1;
    end;
    s := '';
  end;

begin
  i := 0;
  z := 0;
  s := '';
  if t > '' then
  begin
    while i <= Length(t) + 1 do
    begin
      c := t[i];
      case Mode of
        0: {русские и английские слова}
          if (c in ['a'..'z']) or (c in ['A'..'Z']) or (c in ['а'..'я']) or
            (c in ['А'..'Я']) and (c <> ' ') then
            s := s + c
          else
            Check;
        1: {только русские слова}
          if (c in ['а'..'я']) or (c in ['А'..'Я']) and (c <> ' ') then
            s := s + c
          else
            Check;
        2: {только английские слова}
          if (c in ['a'..'z']) or (c in ['A'..'Z']) and (c <> ' ') then
            s := s + c
          else
            check;
      end;
      i := i + 1;
    end;
  end;
  result := z;
end;

Пример использования:

procedure TForm1.Button1Click(Sender: TObject);
var
  Source, Dest: Tstrings;
  i: integer;
begin
  Source := TstringList.Create;
  Dest := TstringList.Create;
  Source.LoadFromFile('c:\MyText.txt');
  for i := 0 to Source.Count - 1 do
  begin
    StringToWords(Source[i], 2, Dest);
    Application.ProcessMessages;
  end;
  Dest.SaveToFile('c:\MyWords.txt');
  ShowMessage('Найдено ' + IntToStr(Dest.Count) + ' слов');
end;

Программа на Delphi!

Функция StringToWords, которая разбивает заданный текстовый строку на отдельные слова и возвращает количество слов. Функция принимает три параметра:

  1. T: строка, содержащая входной текст.
  2. Mode: целочисленное значение, определяющее способ разделения слов:
    • 0: оба английские и русские слова учитываются (по умолчанию).
    • 1: только русские слова учитываются.
    • 2: только английские слова учитываются.
  3. List (опционально): список строк (TStrings), в который можно хранить найденные слова.

Функция проходит через входную строку, проверяя каждый символ, чтобы определить, является ли он частью слова или разделителем (пробел, знаки препинания и т.д.). Когда слово обнаруживается, функция добавляет это слово в список (List, если предоставлен) и увеличивает счетчик слов. Наконец, функция возвращает общее количество слов.

Пример использования:

procedure TForm1.Button1Click(Sender: TObject);
var
  Source, Dest: TStrings;
  i: integer;
begin
  Source := TStringList.Create;
  Dest := TStringList.Create;
  Source.LoadFromFile('c:\MyText.txt');
  for i := 0 to Source.Count - 1 do
  begin
    StringToWords(Source[i], 2, Dest);
    Application.ProcessMessages;
  end;
  Dest.SaveToFile('c:\MyWords.txt');
  ShowMessage('Найдено ' + IntToStr(Dest.Count) + ' слов');
end;

В этом примере коде программа читает текстовый файл MyText.txt, разбивает каждый строку на отдельные слова с помощью функции, и сохраняет результаты в новый файл MyWords.txt. Затем программа отображает сообщение об ошибке с общим количеством найденных слов.

Разделение текста на слова и получение количества слов в тексте с помощью функции StringToWords, которая поддерживает режим разбиения по русским или английским словам.


Комментарии и вопросы

Получайте свежие новости и обновления по Object Pascal, Delphi и Lazarus прямо в свой смартфон. Подпишитесь на наш Telegram-канал delphi_kansoftware и будьте в курсе последних тенденций в разработке под Linux, Windows, Android и iOS




Материалы статей собраны из открытых источников, владелец сайта не претендует на авторство. Там где авторство установить не удалось, материал подаётся без имени автора. В случае если Вы считаете, что Ваши права нарушены, пожалуйста, свяжитесь с владельцем сайта.


:: Главная :: Текст и Строки ::


реклама


©KANSoftWare (разработка программного обеспечения, создание программ, создание интерактивных сайтов), 2007
Top.Mail.Ru

Время компиляции файла: 2024-12-22 20:14:06
2025-04-04 05:54:03/0.007584810256958/1