Encontrar e extrair um número em uma string (em C#, incluindo Span<T>)

Outro dia, estava procurando estratégias para encontrar e extrair números em strings e cheguei a seguinte estratégia, como a mais popular, no Stackoverflow.

 

O código é simples (o que é bom). Entretanto, a Regex não compilada, junto com as alocações repetidas de strings pressionando o GC não parecem performáticas.

Resolvi fazer algumas soluções alternativas para comparação com a solução proposta. Foram elas:

  • Regex compilados e parsing;
  • Busca caractere-por-caractere por números, extração com substring e parsing;
  • Busca caractere-por-caractere por números, extração com span e parsing;

Também resolvi comparar as performances para encontrar, extrair e converter números no início, no meio e no fim de strings.

using System;
using System.Runtime.CompilerServices;
using System.Text.RegularExpressions;

using BenchmarkDotNet.Attributes;
using BenchmarkDotNet.Running;

[MemoryDiagnoser]
public class Program
{
    static void Main(string[] args)
    {
        BenchmarkRunner.Run<Program>();
    }


    [Benchmark]
    [Arguments("42, starting with a number.")]
    [Arguments("With a number 42 in the middle.")]
    [Arguments("The secret number is 42.")]
    [Arguments("42")]
    public int ExtractIntUsingRegex(string input)
    {
        var number = Regex.Match(input, @"d+").Value;
        return int.Parse(number);
    }

    
    Regex numberExtractor;
    [GlobalSetup]
    public void GlobalSetup()
    {
        numberExtractor = new Regex(@"d+", RegexOptions.Compiled);
    }

    [Benchmark]
    [Arguments("42, starting with a number.")]
    [Arguments("With a number 42 in the middle.")]
    [Arguments("The secret number is 42.")]
    [Arguments("42")]
    public int ExtractIntUsingCompiledRegex(string input)
    {
        var number = numberExtractor.Match(input).Value;
        return int.Parse(number);
    }

    [MethodImpl(MethodImplOptions.AggressiveInlining)]
    private static (int Start, int Length) GetNumberPosition(string s)
    {
        var start = 0;
        for (int i = 0; i < s.Length; i++)
        {
            if (char.IsDigit(s[i]))
            {
                start = i;
                break;
            }
        }

        for (int i = start + 1; i < s.Length; i++)
        {
            if (!char.IsDigit(s[i]))
            {
                return (start, i - start);
            }
        }

        return (start, s.Length - start);
    }

    [Benchmark]
    [Arguments("42, starting with a number.")]
    [Arguments("With a number 42 in the middle.")]
    [Arguments("The secret number is 42.")]
    [Arguments("42")]
    public int ExtractIntUsingSubstring(string input)
    {
        var position = GetNumberPosition(input);
        return int.Parse(input.Substring(position.Start, position.Length));
    }

    [Benchmark]
    [Arguments("42, starting with a number.")]
    [Arguments("With a number 42 in the middle.")]
    [Arguments("The secret number is 42.")]
    [Arguments("42")]
    public int ExtractIntUsingSpan(string input)
    {
        var position = GetNumberPosition(input);
        var numberSpan = input.AsSpan(position.Start, position.Length);
        return int.Parse(numberSpan);
    }
}

Os resultados obtidos foram bem esclarecedores.

Como imaginava, a performance da estratégia popular no Stackoverflow se mostrou como a menos eficiente em todos os cenários testados.  Utilizar uma Regex compilada melhorou a performance consideravelmente.

A solução utilizando Substring teve a melhor performance quando a string possuia apenas o número.

A solução utilizando Span foi consistentemente a mais eficiente em todos os demais cenários (mérito por não fazer alocações e não gerar coletas). Aliás, essa estratégia de “não alocação” é a grande responsável pela melhoria de performance que temos observado em .NET.

Sugestões para tornar esse código mais performático?

Compartilhe este insight:

Comentários

Participe deixando seu comentário sobre este artigo a seguir:

Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments

AUTOR

Elemar Júnior
Fundador e CEO da EximiaCo atua como tech trusted advisor ajudando empresas e profissionais a gerar mais resultados através da tecnologia.

NOVOS HORIZONTES PARA O SEU NEGÓCIO

Nosso time está preparado para superar junto com você grandes desafios tecnológicos.

Entre em contato e vamos juntos utilizar a tecnologia do jeito certo para gerar mais resultados.

Insights EximiaCo

Confira os conteúdos de negócios e tecnologia desenvolvidos pelos nossos consultores:

Arquivo

Pós-pandemia, trabalho remoto e a retenção dos profissionais de TI

CTO Consulting e Especialista em Execução em TI
0
Queremos saber a sua opinião, deixe seu comentáriox
Masterclass

O Poder do Metamodelo para Profissionais Técnicos Avançarem

Nesta masterclass aberta ao público, vamos explorar como o Metamodelo para a Criação, desenvolvido por Elemar Júnior, pode ser uma ferramenta poderosa para alavancar sua carreira técnica em TI.

A sua inscrição foi realizada com sucesso!

O link de acesso à live foi enviado para o seu e-mail. Nos vemos no dia da live.

Muito obrigado!

Deu tudo certo com seu envio!
Logo entraremos em contato

Encontrar e extrair um número em uma string (em C#, incluindo Span<T>)

Para se candidatar nesta turma aberta, preencha o formulário a seguir:

Encontrar e extrair um número em uma string (em C#, incluindo Span<T>)

Para se candidatar nesta turma aberta, preencha o formulário a seguir:

Condição especial de pré-venda: R$ 14.000,00 - contratando a mentoria até até 31/01/2023 e R$ 15.000,00 - contratando a mentoria a partir de 01/02/2023, em até 12x com taxas.

Tenho interesse nessa capacitação

Para solicitar mais informações sobre essa capacitação para a sua empresa, preencha o formulário a seguir:

Tenho interesse em conversar

Se você está querendo gerar resultados através da tecnologia, preencha este formulário que um de nossos consultores entrará em contato com você:

O seu insight foi excluído com sucesso!

O seu insight foi excluído e não está mais disponível.

O seu insight foi salvo com sucesso!

Ele está na fila de espera, aguardando ser revisado para ter sua publicação programada.

Tenho interesse em conversar

Se você está querendo gerar resultados através da tecnologia, preencha este formulário que um de nossos consultores entrará em contato com você:

Tenho interesse nessa solução

Se você está procurando este tipo de solução para o seu negócio, preencha este formulário que um de nossos consultores entrará em contato com você:

Tenho interesse neste serviço

Se você está procurando este tipo de solução para o seu negócio, preencha este formulário que um de nossos consultores entrará em contato com você:

× Precisa de ajuda?