Карта сайта Kansoftware
НОВОСТИУСЛУГИРЕШЕНИЯКОНТАКТЫ
KANSoftWare

Разбивка строки на слова

Delphi , Базы данных , ASCII и CSV

Разбивка строки на слова

Приведу несколько простых функций, позволяющих работать с отдельными словами в строке. Возможно они пригодятся вам для разбивки текстовых полей на отдельные слова (for i := 1 to NumToken do ...) с последующим сохранением их в базе данных.


function GetToken(aString, SepChar: string; TokenNum: Byte): string;
{
параметры: aString : полная строка

SepChar : единственный символ, служащий
разделителем между словами (подстроками)
TokenNum: номер требуемого слова (подстроки))
result    : искомое слово или пустая строка, если количество слов

меньше значения 'TokenNum'
}
var

  Token: string;
  StrLen: Byte;
  TNum: Byte;
  TEnd: Byte;

begin

  StrLen := Length(aString);
  TNum := 1;
  TEnd := StrLen;
  while ((TNum <= TokenNum) and (TEnd <> 0)) do
  begin
    TEnd := Pos(SepChar, aString);
    if TEnd <> 0 then
    begin
      Token := Copy(aString, 1, TEnd - 1);
      Delete(aString, 1, TEnd);
      Inc(TNum);
    end
    else
    begin
      Token := aString;
    end;
  end;
  if TNum >= TokenNum then
  begin
    GetToken1 := Token;
  end
  else
  begin
    GetToken1 := '';
  end;
end;

function NumToken(aString, SepChar: string): Byte;
{
parameters: aString : полная строка

SepChar : единственный символ, служащий
разделителем между словами (подстроками)
result    : количество найденных слов (подстрок)
}

var

  RChar: Char;
  StrLen: Byte;
  TNum: Byte;
  TEnd: Byte;

begin

  if SepChar = '#' then
  begin
    RChar := '*'
  end
  else
  begin
    RChar := '#'
  end;
  StrLen := Length(aString);
  TNum := 0;
  TEnd := StrLen;
  while TEnd <> 0 do
  begin
    Inc(TNum);
    TEnd := Pos(SepChar, aString);
    if TEnd <> 0 then
    begin
      aString[TEnd] := RChar;
    end;
  end;
  Result := TNum;
end;

// Или другое решение:

function CopyColumn(const s_string: string; c_fence: char;
  i_index: integer): string;
var
  i, i_left: integer;
begin

  result := EmptyStr;
  if i_index = 0 then
  begin
    exit;
  end;
  i_left := 0;
  for i := 1 to Length(s_string) do
  begin
    if s_string[i] = c_fence then
    begin
      Dec(i_index);
      if i_index = 0 then
      begin
        result := Copy(s_string, i_left + 1, i - i_left - 1);
        exit;
      end
      else
      begin
        i_left := i;
      end;
    end;
  end;
  Dec(i_index);
  if i_index = 0 then
  begin
    result := Copy(s_string, i_left + 1, Length(s_string));
  end;
end;

Я знаю что в GetToken параметр SepChar (в моем случае c_fence) строка, не символ, но комментарий гласит, что функция ожидает единственный символ в этой строке, и это очевидно, поскольку если вы пошлете более одного символа, функция попросту несработает. ( Delete(aString,1,TEnd) будет ошибкой, если Length( SepChar ) > 1 ).

Привет! Я переведу контент на русский язык.

Функции Pascal используются для разделения строки на отдельные слова или токены на основе указанного символа-разделителя.

Функция GetToken принимает три параметра: - aString: входная строка - SepChars: символ-разделитель (например, пробел, запятая и т.д.) - TokenNum: индекс токена, который должен быть возвращен

Возвращает токен на указанном индексе или пустую строку, если есть меньше токенов, чем запрошенный индекс.

Функция NumToken принимает два параметра: - aString: входная строка - SepChars: символ-разделитель

Возвращает количество найденных токенов в строке, считая количество вхождений символа-разделителя и добавляя 1 к каждому счету (поскольку счет начинается с 0).

Функция CopyColumn - это альтернативное решение, которое принимает три параметра: - s_ string: входная строка - c_fence: символ-разделитель - i_index: индекс токена, который должен быть возвращен

Возвращает токен на указанном индексе или пустую строку, если есть меньше токенов, чем запрошенный индекс.

Вы правы в том, что параметр SepChars - это строка, а не одиночный символ. Это может привести к ошибкам, если в входной строке присутствуют более одного символа-разделителя. Для исправления этого можно модифицировать функции, чтобы они итерировали по каждому символу строки SepChars и использовали его как разделитель.

Вот обновленная версия функции GetToken:

function GetToken(aString, SepChars: string; TokenNum: Byte): string;
var
  i, j, StrLen, TNum, TEnd: Byte;
begin
  StrLen := Length(aString);
  TNum := 1;
  TEnd := StrLen;
  while (TNum <= TokenNum) and (TEnd <> 0) do
  begin
    for i := 1 to Length(SepChars) do
    begin
      j := Pos(Copy(SepChars, 1, i), aString);
      if j <> 0 then
      begin
        TEnd := j - 1;
        break;
      end;
    end;
    if TEnd <> 0 then
    begin
      Token := Copy(aString, 1, TEnd);
      Delete(aString, 1, TEnd + Length(SepChars));
      Inc(TNum);
    end
    else
    begin
      Token := aString;
    end;
  end;
  if TNum >= TokenNum then
  begin
    Result := Token;
  end
  else
  begin
    Result := '';
  end;
end;

В этой обновленной функции SepChars используется для поиска позиции каждого символа-разделителя в входной строке. Цикл итерирует по каждому символу строки SepChars и использует его как разделитель для разбиения входной строки на токены.

Обратите внимание, что это только одна из возможных решений, и может быть другие подходы в зависимости от вашей конкретной задачи и ограничений.

Разбивка строки на слова: описаны две функции на языке Pascal для извлечения отдельных слов из текстовой строки с помощью разделителя.


Комментарии и вопросы

Получайте свежие новости и обновления по Object Pascal, Delphi и Lazarus прямо в свой смартфон. Подпишитесь на наш Telegram-канал delphi_kansoftware и будьте в курсе последних тенденций в разработке под Linux, Windows, Android и iOS




Материалы статей собраны из открытых источников, владелец сайта не претендует на авторство. Там где авторство установить не удалось, материал подаётся без имени автора. В случае если Вы считаете, что Ваши права нарушены, пожалуйста, свяжитесь с владельцем сайта.


:: Главная :: ASCII и CSV ::


реклама


©KANSoftWare (разработка программного обеспечения, создание программ, создание интерактивных сайтов), 2007
Top.Mail.Ru

Время компиляции файла: 2024-08-19 13:29:56
2024-11-21 12:29:28/0.0059740543365479/1