Uploaded image for project: 'WebDanica'
  1. WebDanica
  2. WEBDAN-213

Update danica classification code used by the criteriaIngest tool

    XMLWordPrintable

Details

    • Improvement
    • Resolution: Fixed
    • Critical
    • None
    • None
    • ANALYSIS
    • None
    • webdanicasprint - sommer 2017

    Description

      JEI has a number of easy rules, that needs to be implemented before we are ready for PROD usage:

      C1a: >0	danske mail-adresser				
      C2a: >0	tlf.				
      C4b:da: HIGH (0.99	sprog dansk				
      C6a: >20	hyppige danske ord				
      C6b: >1	typiske danske ord				
      C7b: >0	danske bynavne i URLen	Undersøges		
      C7c: >0	danske stednavne i teksten	Finder stadig delord	
      C7e: >0	fremmedsprog af ordene København og Danmark				
      C7g: >0	større danske byer i teksten				
      C7h: >0	fremmedsprog af ordene København og Danmark				
      C9e: >0	danske virksomheder				
      C9d: >0	cvr				
      C9a: >0	a/s, aps				
      C10a: >2	finder -sen-navne i teksten.	Finder andre -sen-ord men den holder
      C10c: >2	hyppige for- og efternavne	Finder stadig delord	
      C17a: >0	outlinks peger på websider i .dk				
      
      

      Attachments

        Activity

          People

            svc Søren Vejrup Carlsen (Inactive)
            svc Søren Vejrup Carlsen (Inactive)
            Watchers:
            1 Start watching this issue

            Dates

              Created:
              Updated:
              Resolved: